還記得瑪麗蓮•沃斯•莎凡特(Marilyn vos Savant)嗎?她是吉尼斯世界記錄認定的最高IQ人類,在雜誌《Parade》上開過一個名叫“問問瑪麗蓮”(Ask Marilyn)的專欄,專門解決讀者的各種疑難雜題,最著名的自然是“ 三門問題 ” ,她高明且不可思議的回答讓無數人傷透了腦筋。不過常在河邊站哪有不濕鞋,就是這樣一個“IQ最高”的人,也有糊塗的時候。來看看這道連瑪莉蓮都回答錯的題吧。

瑪莉蓮的失誤

2002年3月31日的“問問瑪莉蓮”專欄上刊登了這麼一道趣題:你正在圖書館枯坐,一位陌生美女主動過來和你搭訕,並要求和你一起玩個數學遊戲(這不是死理性派最期待的嘛)。美女提議:“讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那麼我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了。”那麼該不該和這位姑娘玩這個遊戲呢?這基本是廢話,當然該。問題是,這個遊戲公平嗎?
有人就這麼算起來了:正反的組合有四種等概率的情況,出現其中兩種情況我要付出2+2=4 元,出現另外兩種情況可以得到3+1=4元,不虧不賺,這是個公平的遊戲嘛。那就玩唄,更何況人家是美女。
這樣想的老兄不是太單純就是因為幸福來得太突然被沖昏了大腦。在這裡他天真地假定每人都以相等的概率出正反面。還是女人了解女人,瑪莉蓮就想到了美女可以控制正面出現的概率,她給出解答說:“你不能和她玩這個遊戲吶,她只要以1/3的概率出正面,2/3的概率出反面,每6次遊戲你就輸1元喲。”
畫出收益矩陣(payoff matrix),可以算出“好運”的你每次的期望收益真的是-1/6元,如此看來,這還真不是個公平遊戲。
 美女出正面(P=1/3)美女出反面(P=2/3)
你出正面(P=1/2)1/2-2/3
你出反面(P=1/2)-1/31/3
瑪莉蓮的故事結束了,但是好戲才剛剛開始。且不說美女是否一定就用這個”1/3的概率出正面,2/3的概率出反面”的方案,就是對於瑪莉蓮給出的美女策略,死理性派也完全可以把它變成一個公平的遊戲。
顯然瑪莉蓮這次低估了死理性派的智商,難道只有美女會控制頻率嗎?對於瑪莉蓮版本的美女,我們完全可以一直出反面,三次遊戲中我們平均可以得到1+1 元,失去2元,收支平衡,遊戲變得公平了。

真正的不公平

需要指出的是,這個遊戲確實不是公平的,只不過瑪麗蓮採用了錯誤的分析方法。
人們在玩遊戲的時候總會自己制定一些策略。在博弈論中,策略(strategy)有兩種,一種是確定的,稱為純策略(pure strategy),在什麼情況下出什麼牌、做出什麼選擇都已經定好,只需要照章辦事。另一種是隨機的,叫作混合策略(mixed strategy),給你的所有動作都定一個概率,按概率隨機從中選一個。人們在說到隨機的時候,直覺上傾向於認為各種情況等概率出現,而有時候,控制某些情況出現的概率卻會產生神奇的效果。上面我們已經看到瑪莉蓮就採用了混合策略,而我們又想出了新的混合策略來應對。
任何一個遊戲中,玩家們都會想方設法讓自己的利益最大化,有時甚至作出出人意料的決定,這讓遊戲的局勢變得錯綜複雜,典型的例子就是“ 海盜分金問題 ” 。可在這複雜的關係下,存在一個驚人的規律,那就是在有限人的遊戲中,總存在這樣一種情況,每個人都能採取一種策略,使得他的利益不能再增大了。這就是博弈論中重要的納什均衡(Nash Equilibrium)。納什均衡分為純策略納什均衡(pure strategy Nash equilibrium)和混合策略納什均衡(mixed strategy Nash equilibrium),前一種是所有玩家都採取純策略,後一種則是至少有一人採取混合策略。
回到美女請你玩遊戲這個問題。列出我們的收益矩陣:
 美女出正面美女出反面
你出正面3-2
你出反面-21
在m行n列的收益矩陣a中,存在如下不等式:
數學,概率,博弈
當它能取到等號時,遊戲存在純策略納什均衡。簡單來說就是玩家都能夠採取固定的策略(比如一直出正面或者一直出反面),使得每人都賺得最多或虧得最少。否則只存在混合策略納什均衡。而在這個問題中,行最小值的最大值(-2)不等於列最大值的最小值(1),所以這個遊戲只存在混合策略納什均衡。
假設我們出正面的概率是x,反面的概率是1-x。為了使利益最大化,應該在對手出正面或反面的時候我們的收益都相等,不然對手總是可以改變正反面出現的概率讓我們的總收入減少,由此列出方程就是
3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
解方程得x=3/8,也就是說平均每八次出示3次正面, 5次反面是我們的最優策略。而將x= 3/8代入到收益表達式3*x + (-2)*(1-x) 中就可得到每次的期望收入,計算結果是-1/8元。
類似的,列出美女的收益矩陣。
 你出正面你出反面
美女出正面-32
美女出反面2-1
設美女出正面的概率是y,反面的概率是1-y,列方程
-3y + 2( 1-y )= 2y + (-1) * ( 1-y )
解得y也等於3/8,而美女每次的期望收益則是2(1-y)- 3y = 1/8元。這告訴我們,在雙方都採取最優策略的情況下,平均每次美女贏1/8元。
其實只要美女採取了(3/8,5/8)這個方案,不論你再採用什麼方案,都是不能改變局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2- 2+1+1+1+1+1)/8=-1/8元。而任何策略無非只是上面兩種策略的線性組合,所以期望還是-1/8元。但是當你也採用最佳策略時,至少可以保證自己輸得最少。否則,你肯定就會被美女採用的策略針對,從而賠掉更多,比如上述瑪麗蓮的解答。
另外借助於計算機模擬這個遊戲,我們也可以輕而易舉地得到一樣的結論。這裡附上一個這樣的小程序,算是另一個證明吧。
數學,概率,博弈
說到這裡,美女之心,路人皆知了。不過既然是主動送上門,而你又不會輸得太多,不妨考慮採用最佳策略慢慢陪她玩吧。說不定這個美女足夠聰明,察覺到了你早已洞察一切卻依然紳士,好感油然而生,改變心意了呢。