張慶瑞專欄

古典賽局的破綻,必勝的量子策略──以曹操敗走華容道為例

作者:文・圖/張慶瑞

前記:驚聞「賽局理論」大師巫和懋教授因病離世,巫教授在臺大時開設「賽局與產業競爭策略」課程,傳授賽局理論來判斷對手行動與反應,影響臺灣產業與政治甚大。巫教授於2006年前往北京大學震撼兩岸,巫教授曾說「我沒有因為一時小利,而阻礙了我人生的重大決策。」決策就是賽局理論中的重要產出,巫教授專精心理賽局,當時想必演練多次後,方做出遷移的重大決策。如今賽局理論在世局更加詭譎多變之時,已經進化為量子賽局,特以此文紀念巫和懋教授在古典賽局理論的貢獻。

一、前言


生活策略與人息息相關,從小時候玩剪刀石頭布開始,觀察對方出拳動作後,再決定自己如何出拳就是策略。成長過程中,打牌下棋與玩電動都是不斷由實踐中訓練出策略的直覺反應。等到賀爾蒙滋生,愛苗突現時,更是費盡心思去不斷尋找各種策略來「征服」對方,互動衝突與妥協對抗的過程是愛情賽局中最迷人之處。策略是生活智慧的累積,也是生命藝術的展現。人從出生到進棺材前,都在命運賽局中,『成者為王敗者為寇』幾乎成鐵律,掌握必勝策略也是人人的夢想。


兩千多年前的《孫子兵法》是最早的賽局博弈理論之一,賽局哲學最高指導原則「百戰百勝非善之善者,不戰而屈人之兵,善之善者」,「無恃其不攻,恃吾有所不可攻;無恃其不來,恃吾有所不可待也」在《孫子兵法》已經完整陳述,但進行賽局時,需要有詳細的實施策略與案例。現代賽局策略起源於「賽局理論之父」馮紐曼(John von Neumann)在1928 年的《策略博弈論》(On the Theory of Strategy of Strategy),而真正變成「策略科技」的實務操作與模擬策略則是1944年由馮紐曼與摩根斯特恩(Oskar Morgenstern)的《賽局理論與經濟行為》開始。近代利用電腦模擬進行賽局,依計算結果進而找出最佳攻防策略,兵棋推演成了戰爭勝負判斷重要準則。賽局中的重要獲勝因素是要能設身處地去判斷對手的理性反應行為,商場上的常勝軍在對付不同競爭對手時,總是因地因時而採取不同策略擊敗對手。諸葛亮就是能掌握周瑜與曹操各自的理性反應行為模式而採用不同打擊策略,所以能以寡擊眾而取得最後勝利。


古典賽局論已用在許多領域中,但由於現代賽局的參賽者不只限於人類,也包括機器人及各種邏輯軟體的綜合智慧體,複雜度已遠遠超過單純人類間的互動。因此現在賽局必須利用人工智慧才能處理多元參賽者間的協商與競爭,與即時分析各種智慧體的偏好與反應,並進而找出最佳策略。最佳策略必須透過概念邏輯和演算法來尋找,概念邏輯是定義獲勝結局的平衡結果所在位置,而演算法則是儘快找到平衡結果的過程。人工智慧與賽局論的結合,面臨許多不確定性和非理性的變化,AI參賽者的非理性發展容易造成賽局的失控,這也是現代戰爭不能完全依賴AI進行的主因。

二、量子賽局


由於量子科技進步,賽局理論中也開始大量引入量子思維與量子工具,造成量子賽局與古典賽局有顯著不同的發展與結局。量子糾纏和疊加不但快速得出最佳策略,甚至完全改變古典賽局的結果。1998 年David A. Meyer 在《量子策略》(QUANTUM STRATEGIES)中提出量子賽局,以《銀河飛龍》的Picard船長和Q在黑盒子中的翻轉硬幣遊戲作為例,如圖1,先將十元硬幣放在黑盒子內。遊戲開始後,雙方都可以把手伸進盒子,然後是選擇翻轉硬幣(F)或者是維持原狀(I)。如果Q先手放在黑盒子中,他可以選擇翻轉硬幣(F)或是維持原狀(I);接著輪到Picard伸手入黑盒子中做同樣的翻轉或不翻轉選擇。經過兩人數次來回之後,如果硬幣最終出現正面的孫中山頭像,則Q輸掉十元硬幣,否則Picard必須給Q十元。Picard船長知道這是一種零和賽局且雙方的獲勝概率都是50%,因此毫不猶豫的答應比賽。但實戰中卻發現是不管玩多少次,他總是輸家,Picard船長因此認定Q作弊了。但事實上Q並不需要作弊,他只要引入一個古典策略中不存在的「翻轉與不翻轉」的量子疊加態的操作策略,換句話說,如圖中的硬幣旋轉方式,aF+bI,就必然獲勝。可是如果Picard船長和Q都同時使用量子策略時,則Q的量子優勢就會消失。

圖1:(A) 量子賽局中的策略是古典賽局中所無法想像的,古典的策略只能從思考如何由大門進出,量子策略可以由任何地點穿隧而出。(B) Picard船長與Q的賽局中,Picard只知道古典策略,翻轉硬幣(F)或是維持原狀(I),無法施展出Q的量子旋轉策略(aF+bI),以至於永遠處於古典劣勢。本圖之插圖為大同大學何明果校長所繪。


量子策略源自於量子糾纏與疊加原理,糾纏使得粒子間有彼此無法分開的關聯。參賽者利用量子糾纏在各種策略間建立起古典策略中不存在的聯繫,進而改變賽局的發展與實施策略。在古典策略中,參賽者通常無法隨時隨地進行策略性協商,而量子策略利用量子糾纏進行『隱形』的策略協商。如圖1中,古典賽局參賽者的思維被限制在只能開大門走大路,量子賽局的參賽者卻使用不同規則,無所不在的穿隧自由進出!古典策略只有傳統思維,在看到各種神奇量子策略橫空而出時,完全不能理解,也因此絕對無法贏過量子競爭者。跳出框架思考(Think outside the box)在某種層次就是一種量子啟發思維,不要侷限在傳統思維中,但是量子啟發思維仍然遠不如真正能掌握量子全方位思維的賽局參賽者。量子賽局與古典賽局的主要差別來自量子資訊物理學的延伸,思維邏輯上主要有以下不同之處:

(A)初始狀態的疊加與糾纏:以翻轉錢幣為例,量子初始態可以多出了正面與反面的疊加態。如果兩個或多個初始態彼此糾纏,也代表這些初始態不再是獨立,會透過糾纏影響彼此狀態。

(B)策略的疊加與糾纏:在古典賽局中,參賽者必須在許多可能策略中,選擇特定策略進行。量子賽局中,所有策略都可以疊加與糾纏,這表示可以同時採取多種策略的隨機組合,這種嶄新的策略應用,增加賽局的複雜性。由於策略糾纏在一起,量子賽局的策略空間可以擴展到更大的策略空間去搜尋最佳方案,古典賽局的策略空間就只是量子策略空間的一個子集合。量子策略依序操作於量子態後,會逐步演化為不同狀態,多個古典策略的操作是無法彼此影響,但是多個量子策略因為糾纏而產生更複雜的發展。

(C)量子並行性:量子系統可以並行處理,同時探索多個場景,帶來更有效的策略計算和分析,特別是在具有多種可能結果的複雜賽局中。

(D)量子干涉:量子干涉是機率波產生建設性或破壞性干涉,與古典策略的粒子特性完全不同,也導致非直觀且獨特的策略結果。

(E)安全量子通訊:例如量子金鑰分發,增強通訊協定的保密,可以使得量子參賽者出現『隱形』的策略協商,進而提升了獲勝機率。

(F)量子納許均衡:由於策略的疊加與糾纏,量子賽局會出現古典納許均衡以外的更多種新型態的平衡狀態。

(G)量子計算:透過利用量子演算法和計算優勢,可更快速找出最佳策略。

量子疊加表示參賽者可以同時採取多種策略,古典賽局中參賽者的策略通常只有合作或是競爭。量子賽局論利用量子力學原理將糾纏與疊加元素引入策略互動中,造成更豐富而複雜的結果。量子賽局論仍不斷發展中,將量子資訊引入多人賽局中可以實現古典賽局中所沒有的新型「均衡策略」,參賽者的糾纏可以產生契約效果,防止參賽者從背叛中獲利。下面以兩個常見案例來說明引入量子策略的優勢。

(甲)量子囚徒困境


量子囚徒困境是個有趣案例,古典囚徒困境中有兩人都告密的非合作的納許均衡,也有保持沉默而不損害任何人利益的帕雷托最優。在量子策略下,結果更加複雜與多元。在古典的囚徒困境中,隔離囚犯間不允許交換資訊是困境的來源,否則賽局必然發展成為兩人合作保持沉默。但兩個量子參賽者可以糾纏在一起,就不會出現古典情況中必須分別獨立選擇策略的困境,「量子策略」會因為參賽者間糾纏強弱程度不同而衍生出各種不同的賽局結果。在古典囚徒困境中,由於缺乏交換資訊,告密變成最合邏輯的生存策略。在量子賽局中,結局完全取決於系統中糾纏強弱程度,糾纏就代表資訊的交換能力,糾纏愈強,就愈不需要告密。在量子囚徒困境中,雙方選擇背叛對方仍然是一種均衡,但依糾纏強弱,會出現多種新型態均衡的結局,甚至在適當的糾纏狀態下,可以使得納許均衡就是帕雷托最優。量子賽局論雖然提供更寬廣的空間與更多策略運籌,但仍受限於硬體與實際環境中的可操作工具,所以近年也與人工智慧結合發展出新型態的人工智慧量子賽局論。

(乙)曹操敗走華容道

曹操赤壁戰敗後逃回中原,諸葛亮下令由趙雲,張飛以及關羽於三處伏擊。經過趙雲及張飛兩關後,曹操只剩三百餘騎倉皇逃出,只見眼前兩條岔路,大道之上悄然無聲,而華容小道上有煙火燎繞。曹操認定是諸葛亮所使的空城計,便下令朝華容道而去,結果上當慘敗,但最後卻因關羽念及舊情而還是義釋曹操逃走。

表1:曹操敗走華容道的賽局中的四種策略模式:(A)古典零和遊戲。(B)古典混合策略:加入誘因,提高p值,增加成功率。(C)諸葛亮會使用量子策略(a甲+b乙),利用兩種埋伏方式的疊加與糾纏性,達到成功保證。(D)曹操也會使用量子策略(c子+d丑),兩人勝負又趨於平衡。


曹操與諸葛亮的華容道的古典賽局是標準的零和遊戲,一方失敗,另一方就獲利。在賽局中,對抗雙方不知道對方策略,曹操的最佳選擇是走關羽不在的大道,諸葛亮的最優策略就是埋伏在曹操要走的路上。諸葛亮在這個賽局中利用曹操的多疑心態,在華容道上燒煙來增加曹操走上華容道的機率P,導致諸葛亮的勝率增加,這也就是古典賽局中常使用的混合策略。當時如果諸葛亮知道量子策略,他可以直接使用有疊加和糾纏的量子策略來取得更高的成功機率。但量子策略的使用條件是取決於賽局的特性和策略涉及的量子效應是否可以真實操作。量子賽局的優勢並不能在所有場合使用,也就是說諸葛亮如果真要採取如下表中之量子策略,必須是大道與華容小道間的埋伏是彼此糾纏,而這在當時的科技是不存在的。而且如同前面Picard 船長與Q的賽局,如果曹操也知道量子策略,則諸葛亮的量子優勢也自然就消失了(表1)

三、結論與展望


詹姆斯・卡斯(James P. Carse)在1986年《有限與無限的賽局:生命的機會》(Endliche und unendliche Spiele: Die Chancen des Lebens)書中,將賽局區分成無限系統與有限賽局兩種:「有限賽局是為了贏得勝利,無限賽局是為了繼續留在賽局中。」人的一生,小至人際關係,大至國際政治,都一直在衝突、妥協與合作之間運動,且是永不中止的重複性的無限賽局。因為成長過程中接觸的下棋與球賽都屬於公平競賽,是不容許競賽雙方有合作空間,否則就是欺騙觀眾的作弊,公平賽局觀念因此深入人心,成為古典賽局的無上道德準則。其實人生中更多的賽局都不像球賽那樣單純,競賽雙方可以協商出非零和的互利範圍,彼此合作「把餅做大」,利用對手的『利己之心』來簽訂互惠的合約來達成雙贏,但有時操作不好也會變成多輸。如臺灣與韓國的多家面板公司定期聚會的『水晶會議』,卻引發2010年美國對臺、韓面板廠的反壟斷官司,就是著名多輸案例。當時如果有量子保密通訊的糾纏工具,『水晶會議』就可能變成如「船過水無痕」的成功案例。目前兩黨每隔數年都要競爭,利用賽局理論找出下次對抗時的有效選戰策略,多年重複賽局的納許均衡報酬也遠超越零和賽局,如何更宏觀且長遠的規劃出疊加思維影響下的既競爭又合作的福國利民策略,才是全民之福。


由於現代時空複雜變化,加上工具的日新月異,使得量子賽局理論快速成熟,利用疊加與糾纏機制進行各種實務模擬,並提供多方競合時的嶄新攻防策略。人工智慧、量子科技與量子賽局的結合,將使得古典賽局趨於絕對劣勢,例如量子金鑰分發提供參賽者的『隱形』聯絡與糾纏的可能性,也提高了獲勝機率。量子賽局可更宏觀與準確的模擬場景,更全面分析對策和理解各種決策成因,也更了解參賽者的理性行為與非理性行為的衝突變化,淬鍊出分析模式與合作方式的最佳策略。量子賽局雖然提供古典賽局所沒有的視角與策略,但由於量子賽局的數學形式和計算複雜性,以及量子硬體技術的發展還未成熟,常導致量子賽局的最佳對抗策略也受限於工具及環境而無法實施。


賽局中面臨不同的選擇時,常在不滿意結局中選擇最輕微損失,也就是「兩害相權取其輕」。人生是永不停止的動態賽局,在資訊不充足的情況下必須做出抉擇,但所有策略都是中國古代的「術」,而追求賽局理論的極致,不應只是找出擊敗對手策略的叢林法則。「百戰百勝非善之善者」,利用量子賽局理論在電腦中模擬各種策略來實現符合群體利益的帕雷托最優合作方式,創造多贏的結局,『手中無術,心中有道』才是量子賽局的最高境界。古典囚徒賽局的個別利益中困境極多,狹隘的國家或公司利益都不足以保障人類群體勝利。未來的科技發展是人類與自然彼此共生互利的嶄新賽局,需要多贏的量子策略才能在詭譎多變的時代中永續發展,再創量子科技高峰,有詩為證曰:『囚徒賽局陷囹圄,歃血割袍失節序,帷幄運籌量力行,糾纏千里征納許』。


張慶瑞小檔案
1979年畢業於臺大物理學系,1988在加州大學聖地牙哥分校取得物理博士學位,1989年二月進入臺大服務,曾經擔任臺大副校長並代理校長。
張教授從事微磁學數值研究與自旋傳輸機制,已發表280篇以上專業論文並獲得28個專利。他是美國物理學會(APS)與國際工程學會(IEEE)會士,及俄國國際工程學會(RIAE)的院士。曾擔任亞洲磁性協會理事長,及臺灣磁性協會理事長暨臺灣物理學會理事長。近來曾主持NTU-IBM量子計畫,積極加速培養新興跨領域人才。近期推動量子計算相關研究,應用於新材料、新藥物合成,與財務金融領域,並創建臺灣量子電腦暨資訊科技協會,擔任理事長。於2022年擔任中原大學物理系講座教授並兼任校級量子資訊中心主任。