我們想讓你知道的是翻開這本書,你會發現──賽局,不僅是一門「與人打交道」的學問,也是人們在決策中能用得上的道理,更是思考問題的好方法之一。你將會更理性地看待對手,成為掌握決策的贏家。



文:萬維鋼

真正的「詭道」是隨機性
首章論述過《三十六計》不可靠的原因,那《孫子兵法》如何呢?

《孫子兵法》確實是本實實在在的用兵戰略總結。但《孫子兵法》並不神祕,它的思想,比如「知己知彼」、「國之大事」、「多算勝,少算不勝」、「君命有所不受」等,在今天看來都已經是常識性的認知。《孫子兵法》確實也包含了一些樸素的賽局思想,比如「圍師必闕」,就是在〈其身不正,雖令不從〉一文中提過的增加敵人的選項。

之所以說《孫子兵法》樸素,是因為現代賽局理論比它要高級得多。

比如《孫子兵法》中有這樣一段:「兵者,詭道也。故能而示之不能,用而示之不用……」它的意思很簡單,就是不能讓敵人知道你的戰術意圖,你要迷惑對手。

這個道理固然沒錯,但是「迷惑對手」這件事,得像這段敘述中所說的那樣,一直說反話嗎?

詭道的悖論

我上中學的時候喜歡踢足球,是一名守門員。雖然我的技術不怎麼樣,但是我知道一些理論:罰踢點球(在罰球點將球往前踢出)的時候,球到達球門只需要不到○.三秒,守門員不可能在這麼短的時間內反應過來,所以只能事先賭一個方向。

點球,是守門員和球員之間的賽局。我還聽說,守門員可以透過球員的眼神判斷他射門的方向。

有一次踢球,我們隊被判了點球。罰球的那名球員是什麼長相、這顆球最後被踢向了哪裡、有沒有罰進,我都忘了,但我清楚記得他的眼神。他的眼睛不停地瞄我右側的方向。按理說他是想朝右邊踢,可是我突然多想了一步。

我知道守門員應該看眼神來判斷方向,那他是不是也知道?他會不會是故意往右邊看,實際上是想往左邊踢呢?又或者說,他會不會也料我能想到他的詭計,然後將計就計,還是會往右邊踢呢?

我參加了一次真正的賽局。罰踢點球是一個可以欺騙對手的遊戲。這種賽局也是賽局理論的鼻祖,馮紐曼當年研究的東西,不過他研究的是打撲克牌。

在德州撲克中,最基本的操作是如果手裡的牌好,就應該加注;如果牌不好,就應該蓋牌退出。但打牌這麼老實可不行。當對手一看你加注,就知道你手裡拿著好牌,他就不會跟了,這樣你怎麼能贏很多錢呢?所以,必須迷惑對手才行。

打牌,一定要善於虛張聲勢。中文大概叫「詐」,英文術語叫「Bluff」。有時候你手中的牌明明不好,也要假裝牌好,選擇加注。可能對手被你嚇住,就不跟了,這樣你就贏了。但更重要的是,要讓對手知道你在牌不好的情況下也會加注,他才會不知道你加注是代表牌好還是牌不好,他也才可能在你因為牌好加注的時候跟著加注。所以即使你的牌特別好,有時候也要假裝牌一般,謹慎地加個小注。

想往左邊踢,就故意往右邊看;明明不能,但是讓對手以為你能——這不就是「能而示之不能」的《孫子兵法》嗎?

但是馮紐曼比《孫子兵法》多了一個洞見。馮紐曼說,你既不能有好牌就加注,也不能有壞牌就加注。你既不能往左邊踢就往左邊看,也不能往左邊踢就往右邊看。只說謊話就等於只說實話,對手只要反著聽就行了。

馮紐曼說,想要真的迷惑對手,必須把謊話和實話混合起來。

混合策略

先前提到的各種賽局,好比納許均衡,你最終只能選擇確定的一招,這種情況叫作「純策略」(Pure Strategies)。

但思考一下點球賽局。當球員往守門員的左側踢,守門員也往左側撲,這個局面是納許均衡嗎?顯然不是。在這種情況下,球員會想改變策略而往右側踢。同樣的道理,如果球員往左側踢,守門員往右側撲,球員又會想要改變策略。無論是哪一種組合,攻守雙方總有一個人想要單方面改變自己的策略,所以點球賽局中沒有納許均衡。嚴格地說,是「沒有純策略的納許均衡」。

因為沒有純策略的納許均衡,所以賽局理論不能告訴球員應該怎麼踢才能踢進。但是,如果球員要罰踢很多次點球,賽局理論可以提供他一個指導,讓他用一個系統取勝。這個系統是「混合策略」(Mixed Strategies)。

所謂混合策略,就是不能老往同一個方向踢,應該按照一定的機率,有時候往左踢,有時候往右踢。

你可能會認為,這不是顯然如此嗎?還用得著賽局理論?注意了,這裡面有個大學問——應該以多少機率往左踢,以多少機率往右踢呢?

假設球員向守門員的左側踢,有時候容易踢偏,導致他更喜歡往右踢。那他能不能以一半的機率往右踢,一半的機率往左踢呢?不行。如果他這麼踢,守門員就會堅決撲向右側,因為左邊更值得交給運氣。按照這樣的踢法,雖然球員的每一腳都不可預測,但是他有個非常明顯的統計趨勢可以被對手利用。

正確的策略應該是:球員首先要知道自己向左踢和向右踢進球的機率分別是多少,然後合理搭配向左踢和向右踢的機率,以至於讓守門員不管是撲向左邊還是右邊,進球的機率都一樣。

也就是說,球員的混合機率選擇,應該把對手能得到的最大報償最小化。在這種情況下,因為守門員向左撲或向右撲都一樣,他就沒有什麼確定的好辦法。馮紐曼證明,這是對球員最有利的混合策略。這個結論,叫作「最小最大值定理」(Minimax Theorem)。

這是賽局理論的一個基本定理,它涉及非常複雜的數學,在此就不細說了,但是這個精神是容易理解的。

第一,要按照一定的機率,混合自己的打法。

第二,混合打法的規律,必須是對手無法利用的。

只說實話不行,只說謊話也不行。在九○%的情況下說實話,一○%的情況下說謊話,也不一定行,因為對手還是可能根據聽實話和聽謊話的實際報償,決定一個最佳應對策略。必須用最小最大值定理計算出一個實話和謊話的最佳配比才行。

後來約翰.納許進一步證明,所有的賽局,不管有多少參與者,都至少存在一個納許均衡——可能是純策略納許均衡,或者是混合策略納許均衡。不管你玩的是什麼遊戲,賽局理論總能給你幫助。

一個理性的守門員和一個理性的球員玩的點球遊戲,必定是雙方各自使用自己的最佳混合策略。誰不用這個混合策略,誰就會被對手抓住破綻。

《三國演義》的「煮酒論英雄」這一段中,曹操對著劉備說了一番「龍之變化」。曹操說:「龍能大能小,能升能隱;大則興雲吐霧,小則隱介藏形;升則飛騰於宇宙之間,隱則潛伏於波濤之內……龍之為物,可比世之英雄。」

曹操說的這番話就有點像最小最大值定理。英雄做事,必須完全沒有可以被敵人利用的規律。

真隨機的好處
你可能會覺得這樣要求太高了,難道罰踢點球之前還要做個數學計算?是的,如果你要罰的這些點球都價值千金,計算就是值得的。事實上,有人統計了一九九五年到二○一二年間職業足球比賽中的九千零一十七個點球,發現這些真實比賽中的點球結果,和最小最大值定理要求的混合策略納許均衡,高度一致。

我們大概可以說,職業球員有一種很專業的比賽感覺,他們知道怎麼樣才能最大限度地迷惑對手。而且近年來,有很多球隊已經在使用專門的軟體工具分析對手和計算自己的策略。在世界盃期間,我們可能經常聽到這樣的報導:點球決勝的時候,守門員手裡有個紙條,上面寫著對方球員最可能的射門方向。我相信紙條上的建議絕對不是對方球員最擅長的方向,而是一個全面考慮的混合策略。

更了不起的是,同樣的研究還表明,職業球員還執行了相當不錯的隨機性。

人類非常不擅長執行隨機。比如我要求你以左、右分別是四○%和六○%的機率踢點球,你會怎麼安排呢?先往左踢四個,再往右踢六個嗎?還是按照左右規律地交替,並在中間多安排幾個右呢?從統計的角度看,這些安排都太整齊了,非常容易被人利用。一般人想到隨機性,會強烈地以為應該交替進行。比如球員前兩次罰踢點球都踢向了左側,這一次可能非常想踢右側——如果球員有這個心理,對手就可能會利用這一點,接下來重點防守右邊。

唯一正確的做法,是執行真的隨機性。比如球員可以隨身帶一本書,每次罰踢點球之前隨便翻開一頁,如果頁碼的個位數是○到三就踢左邊,如果是四到九就踢右邊。

有人觀察了都是業餘選手參加的「剪刀、石頭、布」比賽——真有這樣的比賽——發現業餘選手的特點恰恰就是出手不夠隨機。O他們在原則上可以被人用機率論系統性地打敗。

不是真隨機,就會被破解,這個道理和密碼學一樣。科普作家卓克在得到App有個課程叫《密碼學三十講》,其中專門說過這個道理。

隨機性,才是真正的「詭道」。

這個原理可以應用於多種情況,比如打網球。如果你知道對方的反手比較弱,是不是就應該一直反手回擊呢?不行。因為這麼做,對方就能預測你的打法了。就算你知道他喜歡正手,也得按一定的機率正手回擊,你必須使用混合策略。而職業網球選手真的做到了隨機性的混合策略。他們當然不會隨身攜帶一個亂數產生器,但是他們比業餘選手更隨機。

再比如在足球和籃球比賽中,如果你們隊有個特別能得分的球星,那是不是應該一到前場就把球交給他呢?不行。那樣做的話,你們隊的戰術就是可預測的,對方的防守球員就會重點盯住你們的球星。球星再厲害,你們的隊員也必須以一定的機率將球傳給別的球員。事實上,球星在前場的作用,很大程度是牽制對方的防守兵力。

無論是政府機關檢查產品的品質,或是交通警察查違規停車,一般都是抽查。這個抽查可不能有規律。如果固定在每天下午兩點查停車,別人就會躲過這個點。最好的辦法是隨機抽查。

據說慈禧太后吃飯從來都不是只吃一盤菜,而是面對幾百盤菜隨機地選擇,每樣大概只吃一口,以至於那麼多年,人們依然不知道她愛吃什麼,這樣別人也就不容易在她的飯菜裡下毒了。

還有,在「田忌賽馬」中,想要避免被田忌算計,齊威王的最佳策略也應該是隨機安排出場順序。事實上現在的團體比賽根本不可能讓一方先確定出場名單,讓另一方有安排賽馬的機會。

混合策略不是陰謀,而是陽謀。專門說謊話是搞陰謀,可是陰謀是能夠被識破的。如果使用混合策略,就算把決策方式告訴對手,他也沒辦法破解。陽謀不怕被識破……追根究柢,大家都是納許均衡的奴隸。

問與答
讀者提問:

是不是可以說:「陽謀」才能有納許均衡,「陰謀」就沒有納許均衡?陽謀中有好的資訊對稱,參與者之間幾乎是平等的,而陰謀就缺這些,所以暗度陳倉、火燒赤壁這樣的玩法很難有第二次,因為它們是不平衡的。

我是軟體工程師,開源社群有個理念,叫「愈開放,愈安全」,但反對開源的人也會說原始碼都開放了當然不安全,經常讓企業領導者很糾結要不要開源。這是不是在說開源社群理解了陽謀的厲害,算是在追求一個光明的納許均衡呢?

萬維鋼:

點球賽局中你必須選擇一個方向,而你不管怎麼選,對手都可能猜中,所以沒有純策略納許均衡。你說的這個賽局中,如果軟體有個漏洞是可以被人利用的,而敵人想要獲得這個資訊,這個賽局與點球選擇方向的賽局是不一樣的,因為我們可以選擇不說話。

在這個破解和防破解的賽局中,我們選擇保密,敵人選擇不斷試探,這就是一個納許均衡。你不會想主動公開,敵人也不會停止試探。事實上,我們看到安全領域這種保密和試探的對決,是長期普遍存在。

對關鍵資訊保密不算搞陰謀。因為對手知道你的策略是什麼,他只是不知道你保密的那個資訊內容而已。在我的理解中,陰謀是你指望對手根本不知道你在用哪個策略。

而開源則是一種完全不同的賽局。開源不是洩密,開源軟體的好處並不是它把漏洞放在陽光下讓對手能夠看到,而在於整個社區人人都可以出力彌補這個漏洞。開源軟體安全是因為它已經被眾人完善了。但是從開源到完善需要一個過程,需要社區有人願意參與,大家一起把它做好。

所以從防止被漏洞傷害的角度來說,開源是個治本但不治標的辦法,保密則是個治標但不治本的辦法。我認為實力強大的公司應該自己開發一個品質夠硬的軟體,自己進行內部測試,先不要開源;實力弱小的公司則應該直接使用已經開源的軟體。

書籍介紹
本文摘錄自《高手賽局:「精英日課」人氣作家,教你拆解、翻轉、主導局勢,成為掌握決策的贏家》,遠流出版

作者:萬維鋼

momo網路書店
Pubu電子書城結帳時輸入TNL83,可享全站83折優惠(部分商品除外,如實體、成人及指定優惠商品,不得與其他優惠併用)
透過以上連結購書,《關鍵評論網》將由此獲得分潤收益。

賽局,是一門「與人打交道」的學問!
「精英日課」重磅講者、暢銷作家萬維鋼,
教你以高手眼光解讀賽局,成為掌握決策的贏家

賽局理論是科學版的「三十六計」嗎?
江湖走跳,與人打交道,學黃蓉好?還是學郭靖好?
買車也能應用賽局理論買到最低價嗎?那買賣房子呢?
在職場中,要做鷹派,還是加入鴿派更有優勢?
採取「先聲奪人」還是「後發制人」好?
想防止背叛,就不該縱容,但是要寬容?「以牙還牙」真的好嗎?

這些局面,只要運用賽局觀點,你就能找到「改變規則」的答案!
15個主題 ╳ 25道問答,拆解「賽局理論」中最重要的精華──

看懂「賽局」,就是擁有「上帝視角」
什麼是「賽局理論」?對萬維鋼來說,認識賽局理論(Game Theory)的最好方法正是從「遊戲」(Game)開始!拿出參與者的精神,你才能意識到別人設下的框限;而你要做的,就是在規則內採取對自己最有利的行動。

理解「賽局」,等於為人生注入清醒劑
賽局與人際其實有相當密切的關聯,更能夠應用在日常決策中。本書深入介紹數十種典型賽局,解析囚徒困境、納許均衡、合作與衝突等局面,告訴你「買貴退差價」、「有一種解放叫禁止」、「懸崖策略」的道理。更透過大量生活化的案例,引導你一步步思考──如何改變不好的局面,促成更好的局面。

活用「賽局」,成為打破限制、翻轉局勢的高手
賽局理論的巧妙之處在於,這是研究「有對手」狀況下的決策。你的計畫裡,當然應該要有「他人的計畫」!該怎麼合作?如何防止背叛?有什麼交涉技巧?從單次賽局、重複賽局到動態賽局,從日常生活、商業經濟到國際談判,本書不僅讓你擁有改變規則的意識,更要教你把賽局運用於真實世界當中。

翻開這本書,你會發現──賽局,不僅是一門「與人打交道」的學問,也是人們在決策中能用得上的道理,更是思考問題的好方法之一。你將會更理性地看待對手,成為掌握決策的贏家。





Source