自私的基因:第十二章 好人終有好報 · 1 線上閱讀

「好人墊後。」——這句俗語似乎來自棒球界,不過有些權威人士聲稱它有其他內涵。美國生物學家加勒特·哈丁(Garrett Hardin)用這句俗語來總結「社會生物學」或者「自私的基因」,其中的貼切不言而喻。在達爾文主義中,「好人」是那些願意自身付出代價,幫助種群中其他成員個體,以此使他們的基因傳到下一代。這麼看來,好人的數目註定要減少,善良在達爾文主義里終將滅亡。這裡的「好人」還有另一種專有解釋,和俗語中的含義相差並不遠。但在這種解釋里,好人則能「得好報」。在這一章節里,我將闡釋這個相對樂觀的結論。

想想第十章里的斤斤計較者。那些鳥兒們顯然以利他的方式互相幫助,但對那些曾經拒絕幫助他人的鳥,它們卻懷恨在心,以牙還牙地拒絕給予幫助。比起傻瓜(那些無私奉獻而遭遇剝削的個體)和騙子(那些互相無情剝削而共同毀滅的個體),斤斤計較者在種群中占優勢,因為它們可以將更多基因傳遞給後代。斤斤計較者的故事表達了一個重要原則,羅伯特·特里弗斯將此稱為「互惠利他理論」。在清潔工魚(第十章)的例子裡,互惠利他不僅局限於單個物種,還存在於所有共生關係中。類似的例子還有螞蟻為它們的「奶牛」蚜蟲擠「奶」(第十章)。當第十章寫就時,美國政治科學家羅伯特·阿克塞爾羅德(Robert Axelord)將互惠利他的概念延伸至更為激動人心的方向。阿克塞爾羅德曾與威廉·唐納·漢密爾頓合作,後者的名字在這本書里已經出現無數次了。我開篇已經暗示過,正是阿克塞爾羅德賦予了「好人」一個專有含義。

如同許多其他政治科學家、經濟學家、數學家與心理學家一樣,阿克塞爾羅德對「囚徒困境」這一簡單的博弈遊戲深感興趣。這個遊戲極其簡單,但我知道許多聰明人完全誤解了遊戲,以為其複雜無比。不過,它的簡單也帶有欺騙性。圖書館裡關於這個博弈衍生物的書籍多如牛毛。許多有影響力的人認為它是解決戰略防禦規劃問題的鑰匙,這個模型需被仔細研究,以阻止第三次世界大戰的發生。而作為一個生物學家,我站在阿克塞爾羅德與漢密爾頓一邊。許多野生動物和植物正以其演化進程,精確無誤地進行着「囚徒困境」的博弈。

在其原始的人類版本中,「囚徒博弈」是這樣的:一個「銀行家」判定兩位玩家的輸贏,並對贏家付與報酬。假設我們便是這兩位玩家,當我們開始博弈時(雖然我們將看到,「對立」是我們最不應該做的),我們手中各有兩張卡,分別為「合作」與「背叛」。我們各自選定一張牌,面朝下擺放在桌子上,這樣我們都不知道對方的選擇,也不會為對方選擇所影響。這便等同於我們同時行動。然後我們等待「銀行家」來翻牌。我們的輸贏不僅取決於我們各自出的牌,還取決於對方打出的牌。其懸念在於:雖然我們各自清楚自己的出牌,卻並不知道對方的出牌。我們都只能等「銀行家」來揭曉結果。

我們一共有2×2=4張牌,於是也便有4種可能的結果。為向這個遊戲的發源地——北美致敬,我們以美元來表示這4種輸贏結果。

結果1:我們倆都選擇了「合作」。「銀行家」給我們每個人300美元。這個不菲的總數是相互合作的獎賞。

結果2:我們倆都選擇了「背叛」。「銀行家」對每個人罰款10美元。這是對相互背叛的懲罰。

結果3:你選擇「合作」,我選擇「背叛」。「銀行家」付給我500美元(這是背叛的誘惑),罰了你(傻瓜)100美元。

結果4:你選擇「背叛」,我選擇「合作」。「銀行家」將背叛的誘惑付給了你,而罰了我這個傻瓜100美元。

結果3與4明顯互為鏡像。一個玩家得到好處,則有另一個玩家將付出代價。而在結果1與2里,我們倆則得到相同的結果,而結果1則對我們倆都有好處。這裡金錢的具體數目並不要緊。重要的是這個博弈里「囚徒困境」結果的排列順序:背叛的誘惑>相互合作的獎賞>相互背叛的懲罰>失敗的代價。(嚴格來說,這個博弈還有另一個條件:背叛的誘惑與失敗的代價的平均值不可高於相互合作的獎賞。我們將在後邊附加條件里提到這個原因。)這四種結果總結於表12–1里。

zsdjy1

那麼,為什麼這是一個「困境」?看看這張輸贏狀況的表格,想象一下我在與你博弈時腦海中盤旋着的想法。我知道你只有兩張牌:「合作」或者「背叛」。讓我們按次序來想想。如果你打出「背叛」(這表示我們將看向表格中的右邊一列),我能打出最好的牌也只能是「背叛」。雖然我也將接受相互背叛的懲罰,但我知道,如果選擇了「合作」,失敗者的代價只會更高。而如果你選擇了「合作」(看向左邊一列),我最好的結果也只能是選擇「背叛」。如果我們合作了,我們都能得到300美元;但如果我選擇背叛,我將得到更多——500美元。這裡的結論是:無論你選擇哪張牌,我最好的選擇是:永遠背叛。

我已經運用我無懈可擊的邏輯算出,無論你如何選擇,我都必須「背叛」。而你,也將算出同樣的結果。於是當兩個理性的對手相對時,他們將同時背叛,而也將同時得到罰款,獲得一個較低的分數。雖然每個人都心知肚明,如果他們彼此選擇「合作」,兩人都將得到較高的相互合作的獎賞(我們的例子裡是300美元)。這就是為什麼這個博弈被稱為困境,自相矛盾得令人惱火。這也就是為什麼人們開始提出必須有一個法律來對付這個問題。

「囚徒」來自一個特殊的、想象中的例子,上述例子中的現金被監獄的刑罰所取代。兩個在監獄中的囚徒——姑且稱他們為彼得森與莫里亞蒂,有共同犯罪的嫌疑。囚徒們各自被關押在單獨的牢房裡,並各自被勸誘背叛他的同夥,以將所有犯罪證據栽贓於對方。他們的結果將取決於兩個囚徒的行為,而雙方都不知道對方的選擇。如果彼得森將所有罪過都推向莫里亞蒂,而莫里亞蒂始終保持沉默(與他從前的朋友、現在的叛徒合作),莫里亞蒂將接受重罰,而彼得森則得以無罪釋放,享受背叛的誘惑。如果兩人互相背叛,便都將獲罪,但可以因為供認不諱而得到輕判,這便是互相背叛的懲罰。如果兩人互相與對方而不是當局合作,閉口不談過往,所得證據將不足以把兩人判以重罪,則兩人也都將得到輕判,得到互相合作的獎賞。雖然將牢獄刑罰稱為「獎賞」有點兒奇怪,但比起漫長的鐵窗生涯,犯人們肯定會將此看做獎賞的。你可以發現,雖然這裡的回報不是美元而是牢獄刑罰,這個博弈的主要特徵依然保存着(看看四個結果可取性的排列順序)。如果你將自己放在任何一個囚徒的位置上,假設兩人都以理性的自我利益為動機,你將看到兩人都只能背叛對方,而同樣接受沉重的刑罰。

有沒有逃離困境的方法呢?雙方都知道,無論對方如何選擇,他們能做出的最好的選擇都是「背叛」。但他們也都知道,如果雙方都選擇合作,任何一方都可以得到更多的好處。如果……如果……如果能有一個辦法讓他們達成共識,能有一個辦法讓雙方都堅信對方可以被信任,不至於奔向那個自私的獎賞,能有一個方法來維持雙方共識……

在「囚徒困境」這個簡單博弈里,沒有任何方法可以達成信任。除非其中一方是一個虔誠的傻瓜,善良得根本不可能適應這個世界,這個博弈註定將以相互背叛、相互損傷而告終。然而,這個博弈還有另一個版本:「重複博弈」的「囚徒困境」。這個「重複博弈」更為複雜,但這個複雜性里孕育着希望。

這個「重複博弈」只是簡單將上述博弈與同一個對手無限次重複。你我再次在「銀行家」面前左右相對,再次擁有手中的兩張牌:「合作」與「背叛」,我們再次各自打出一張牌,由銀行家根據上述規則給出獎賞與懲罰。但這一次對弈不再是博弈的終結,我們撿起手中的牌,準備着下一輪。下一輪的遊戲給予我們機會來重新建立信任與懷疑,實施對抗或和解,給予報仇或寬恕。在這一個無限長的博弈里,我們最重要的任務是:贏了「銀行家」,而不是對方。

在10次博弈後,理論上我也許可以獲得最多5 000美元,但只有在你完全愚不可及、或者大公無私地每次都打出「合作」的時候,我才有可能每次都得到最高獎賞「背叛的誘惑」。在更實際一點兒的情況里,我們各自都在10次對弈中打出「合作」,並各自從銀行家裡得到3 000美元。這樣,我們並不需要特別大公無私,因為我們彼此都能從對方過往行為中,知道對方可以信任。我們事實上也在監管着對方的行為。還有另一個也可能發生的結果,我們彼此不信任對方,在10次對弈中都打出了「背叛」,銀行家則從每個人處得到了100美元。最可能發生的是,我們並不完全信任對方,打出了各種次序的「合作」與「背叛」,雙方都得到了並不多的金錢。

在第十章中,那些互相從對方羽毛中捉出蜱蟲的鳥,正是進行一場「囚徒困境」的重複博弈。這怎麼進行呢?你記得,對於鳥來說,從自己身上清除蜱蟲非常重要,但它無法自己清除頭部,只能依靠同伴來幫助它,而讓它同樣報答對方也是公平的。但這項工作耗費了許多時間精力,鳥類在這方面並不寬裕。如果某隻鳥能以欺騙方式從這個小圈子中逃出來,讓別人清除自己的蜱蟲,而拒絕互惠互利,它則能得到所有實惠,而不需支付任何代價。如果你將這些回報結果排列一下次序,你將發現這正是真實的「囚徒困境」博弈。互相合作以清除彼此的蜱蟲固然是好事,但還有着更好的誘惑促使你拒絕支付互惠的代價。互相背叛以拒絕清除蜱蟲固然不是好事,但也沒有比花精力幫別人除蟲而自己無人理睬更不好。表12–2展示了這個回報結果。

zsdjy2

但這只是一個例子。如果你繼續思考,你更會發現,從人類到動植物,生活中充滿了「囚徒困境」的重複博弈。植物?是的。記得我們談到策略時,我們沒有提到有意識的策略(但我們之後可能會提及),但我們提及了「梅納德·史密斯」的意識,這便是一種預定基因的策略。我們之後還會提到植物,動物甚至細菌,他們都在進行着「囚徒困境」的重複博弈。現在,先讓我們詳細探索一下,為何重複博弈如此重要。

在簡單博弈里,我們可以預見「背叛」是唯一的理性策略。但重複博弈並不相同,它提供了許多選擇範圍。簡單博弈里只有兩種策略,合作或是背叛。但重複博弈則可以有很多我們想象得到的策略,並沒有任何一個是絕對的最佳方案。比如「大部分時間合作,而在隨機的1/10時間裡背叛」這個策略,便是成千上萬的策略里中的一個。策略也可以基於過往歷史來作出決定。我的「斤斤計較者」正是一個例子。這種鳥對臉部有很好的記憶力,儘管它基本採取合作策略,但它也會背叛那些曾經背叛過它的對手。還有一些其他策略則可能更為寬容,或者有更短期的記憶。

顯然,重複博弈里可用的策略之多取決於我們的創造力。但我們能夠算出哪個是最佳方案嗎?阿克塞爾羅德也這麼問自己。他想出了一個很具娛樂性的方案:舉行一場競賽。他廣發通知,讓博弈論的專家們來提交策略。在這裡,策略指的是事先確定的行動規則,所以競爭者可以用計算機語言編程加入博弈。阿克塞爾羅德總共收到了14個策略。為了得到更好的結果,他還加了第15個策略,取名為「隨機」。這個策略只是簡單地隨機出 「合作」或「背叛」牌,基本等於「無策略」。如果任何一個其他策略比「隨機策略」的結果更壞,這一定是個非常差的策略。

阿克塞爾羅德將這15個策略翻譯成一種常用的計算機語言,在一個大型計算機中設定這些策略互相博弈。每個策略輪流與其他策略(包括它自己)進行重複博弈。15個策略總共組成15×15=225個排列組合,在計算機上輪番進行。每一個組合需要進行200回合的博弈,所有輸贏累積計算,以得出最終的贏家。