思考,快與慢:第10章 大數法則與小數定律 · 2 線上閱讀

我與阿莫斯開始調查一個問題:只有我自己這麼愚蠢還是我只是眾多愚蠢的人之一,我們通過一項測試來證實這個問題,測試對象為一些數學家,想看看這些人是否也會犯類似的錯誤。我們設計了一份調查問卷,其中描述了真實的研究情境,包括一些成功實驗的複製。問卷要求研究人員選擇樣品大小,對其決定可能帶來的失敗風險進行評估,並為那些正在設計自己實驗的研究生提供建議。在「數學心理學協會」的一次會議上,阿莫斯收集了一組資深受試者(包括兩本經濟學著作的作者)的反應。結果很明顯:我並不是唯一一個愚蠢的人。大多數受試者都會犯和我一樣的錯誤。顯然,即使是專家,在選擇樣品大小時也無法充分集中注意力。

我和阿莫斯將我們合寫的第一篇文章命名為「對小數定律的盲信」。我們半開玩笑地解釋道,「對於隨意取樣的直覺似乎符合小數定律,由此可以斷言大數法則對於小數定律同樣適用」。在文章中,我們還收錄了一個措辭有力的建議,即研究人員認為他們「對於統計直覺應抱有一些懷疑,只要條件允許,都應採用計算方法來確定樣本規模,而不是依靠直覺印象作決定」。

 

信任多於質疑的普遍性偏見

在一次面向300名老年人的電話民意調查中,有60%的人支持總統。

如果你只能用三個詞來總結這句話,該怎麼說呢?幾乎可以肯定的是,你會說「老年人/支持/總統」。這些詞概括了這句話的要點。這次民意調查被省略掉的細節—媒介為電話,樣本為300人—本身意義不大,它們提供的背景信息並不怎麼引人注意。即使樣本數量變了,你的結論也不會發生變化。當然,一個完全荒謬的數字倒可能會引起你的注意。(例如一項對6名或6億名老年選民的電話民意調查……)除非你是專業人員,否則不管樣本是150還是3000,你都不會有什麼不同的反應。這就是「人們對樣本大小沒有足夠的敏感性」這一表述的意義。

這項民意調查包含了兩方面的信息:新聞本身和新聞的來源。當然,你關注更多的是新聞本身,而不是其結果的可信度。但當可信度明顯很低時,新聞所包含的信息也就不足為信了。如果得知「某黨派小組操縱一項錯誤且帶有偏見的民意調查,使結果顯示老年人支持總統……」你當然會排斥這項調查的結果,不會相信這條新聞,這項由某黨派進行的民意調查以及其錯誤結果不但沒有令你信服,反而會成為另一條關於政治騙局的新聞。在這樣清晰的案例中,你可以選擇不相信其中的信息。但是你能把「我在《紐約時報》讀到……」和「我在辦公室閒聊中聽到……」這兩種說法完全區分開來嗎?你的系統1能夠區分出信息的可信度嗎?眼見即為事實的原則表明:不能。

如前所述,系統1並不善於質疑。它抑制了不明確的信息,不由自主地將信息處理得儘可能連貫。除非該信息被立刻否定,不然,它引發的聯想就會擴散開,仿佛這條信息就是千真萬確的。系統2能夠提出質疑,因為它可以同時包含不相容的多種可能性。然而,保持這種質疑會比不知不覺相信其真實性更加困難。小數定律是普遍性偏見的一種表現,即對事物的信任多於質疑。類似這樣的偏見在下面的章節中還會出現。

相信小樣本能反映調查對象的整體情況,這一強烈偏見也是一個較大問題的一部分。這個問題就是,我們常誇大所見事物的相容性和連貫性。許多研究人員過於相信通過有限的幾次觀察得出的結果,這一現象與光環效應緊密相連。我們常常會覺得自己對某個人很熟悉也很了解,但事實上,我們對他卻知之甚少。系統1在了解事實之前就根據零散的證據拼湊了一個飽滿的形象。如果相信小數定律,急於下結論的機制就會運作起來。通常情況下,它會建構一個言之成理的說法使你相信自己的直覺判斷。

 

對隨機事件作出因果解釋必然是錯的

聯想機制會搜尋原因。在統計規則方面,我們面對的困難是這些規則要求使用不同的方法處理問題。依據統計學觀點,我們不應關注當前事件的成因,而應當關注其未來走向。這件事的發生並沒有什麼特殊原因,一切只是機緣而已。

因為偏好進行因果思考,我們在估測真實的隨機事件的隨機性時就會犯嚴重的錯誤。以在某家醫院依次出生的4個嬰兒的性別為例,男女出生次序明顯是隨機的。每個嬰兒的出生是各自獨立的。在前幾個小時內出生的男嬰女嬰數量並不會影響到下一個出生嬰兒的性別。現在,請考慮一下可能的序列:

男男男女女女

男男男男男男

男女男男女男

出現這些序列的可能性是一樣的嗎?人們的第一反應都是「肯定不一樣啊」。但是,這樣的反應是錯誤的。因為每個嬰兒的出生都是獨立的事,並且生男生女的概率也幾乎相等,6個嬰兒任何一種可能的性別順序都與別的順序概率相等。即使是現在,你仍然認為這個結論是正確的,但它實際上是反直覺的,因為只有第三種順序是隨機的。如我們所料,「男女男男女男」比其他兩種順序更有可能發生。我們追求模式,相信所處的是一個各方面都相互聯繫的世界。在這個世界裡,規律(例如6個女嬰的順序)並不只是偶然發生的,它還是機械的因果聯繫或是人的意志的結果。我們並不期待在一個隨機的過程中找到規律。但當探尋到一個可能的規則時,我們就會拋開這個過程是真正隨機的想法。隨機過程會產生許多序列,以使人們相信這個過程完全是不隨機的。如此你就可以看出來為什麼假設的因果關係有進步發展的優勢。它是我們從先輩那裡繼承的一般警覺性的一部分。我們會習慣性地搜尋環境變化的可能性。獅子可能隨時都會出現在平原上,但注意到獅子出現頻率的明顯增長並採取行動則會安全許多,即使這種增長只是由於隨機過程的波動而發生的。

對於隨機性的廣泛誤解有時會帶來重大影響。在我和阿莫斯合作的一篇代表性文章中,我們引用了統計學家威廉·費勒(William Feller)的闡述,他說,人們很容易在根本沒有模式的情況下創建模式。「二戰」期間,火箭彈在倫敦密集地轟炸。人們普遍相信爆炸不可能是隨機的,因為地圖顯示,爆炸點在各地的分布有明顯區別。一些人猜測沒有被炸的地點住有德國的間諜。一份嚴謹的統計分析顯示,爆炸點的分布是隨機程序的一個典型代表,同樣也是令人產生它並不是隨機的這一強烈印象的典型代表。費勒評論道:「在沒受過專業訓練的人看來,這一連串轟炸行動就好像具有某種規律或趨勢了。

「很快,我得到一次機會可以把我從費勒那兒學到的知識派上用場。1973年爆發的贖罪日戰爭中,我作出的唯一一項重大貢獻就是建議以色列空軍的高級官員停止一項調查。一開始,由於埃及地對空導彈表現出色,空戰對於以色列來說很不利。以色列方面人員傷亡慘重,其人員分布也不均衡。有人告訴我說,有兩支來自同一基地的空軍中隊,其中一支被擊落了兩架飛機,而另一支一架也沒有被擊落。為了弄明白那支不幸的空軍中隊到底做錯了什麼,相關人員對此展開了調查。我們沒有理由認為其中一支空軍中隊比另一支更有效率,也並未發現他們在操作上有何不同。當然,飛行員的生活在很多方面會有所不同,據我回憶,其差異包括他們在任務之間回家的次數以及報告任務的執行情況等。我當時給出的建議是,司令部應該明白之所以出現不同結果僅僅只是因為他們運氣不同而已,應該停止對飛行員的調查。我推斷這次事件很可能是由於運氣不佳,對不明顯的原因進行隨機調查必定是勞而無功的。與此同時,空軍中隊不斷有人員損失,沒有必要再給他們增加額外的負擔,讓他們覺得那些去世的夥伴做錯了什麼。

幾年以後,阿莫斯和他的同學湯姆·季洛維奇(Tom Gilovich)、羅伯特·瓦隆(Robert Vallone)對籃球隨機性的錯誤直覺所作的研究引起了轟動。運動員有時投籃順手的「事實」普遍被運動員、教練和球迷們所接受。這樣的推斷是順理成章的:如果一個運動員連續進了三四個球,你就會不由自主作出判斷:這個運動員正處於「投籃順手」的狀態,得分率暫時增加。兩隊隊員都持這種判斷—隊員也更愛將球傳給打得順手的人,對方球隊則會用兩位防守球員防衛這位進攻球員。然而,對上千個投籃動作的分析結果卻十分令人失望:在職業籃球比賽中,無論球是從球場上投出還是從罰球線投出的,根本沒有「投籃順手」這回事。當然,一些球員會比其他球員投籃更准,但進球與投籃未中都只是隨機的。「投籃順手」完全只是旁人所見,而且他們太快作出評判了,以至於感知不到隨機事件中的順序和因果關係。「投籃順手」是一個影響深遠的認知錯覺。

公眾對於這項研究的反應也是這項研究的一部分。這個發現令人驚訝,很快就受到了媒體關注,而大家普遍的反應都是不相信。當著名的波士頓凱爾特人隊教練瑞德·奧爾巴赫(Red Auerbach)聽說了季洛維奇及其發現(研究)時,他回應道:「這人是誰呀?他做了個實驗是吧?不過我對他的觀點不敢苟同。」在隨機性中發現規律的想法往往不可逆轉,肯定比某個人作了一項研究更有說服力。

對規律的錯覺在方方面面影響着籃球賽場。你要用多少年的觀察才能肯定一個投資顧問是有真才實學的?一個執行總裁實現多少次成功的兼併,董事會才能確定他對這項工作有着非凡的才能?簡單說來,如果你聽從自己的直覺,就常常會因為把隨機事件看做是有規律的事件而犯錯。我們都非常願意相信生活中大多數事情並不是隨機的。

在本章開頭,我引用了一個美國癌症發病率的例子。這個例子本來是有意寫給統計學老師看的,我是從前文中提到的兩位統計學家霍華德。維納和哈里斯。澤維林所寫的一篇有趣的文章中看到這個例子的。他們寫這篇文章得到了蓋茨基金會17億美元的贊助,用以調查那些最成功的院校有哪些特點。許多研究人員在那些名聲顯赫的院校中作調查,希望發現這些學校的與眾不同之處,從而尋求成功教學的秘密。這項研究的結論之一是,這些著名院校規模普遍較小。例如在賓夕法尼亞州對1 662所院校的調查中,排名前50的院校里有6所規模都較小,是(普通院校)的3倍多。這個數據使得蓋茨基金會積極投入大量資金建立小規模的院校,有時會採取將大的院校拆分成小的院校的方法。另外,其他著名的機構中至少有一半也採取了同樣的做法,例如愛林伯格基金會和皮尤慈善機構也採取了同樣的做法,美國教育部還啟動了「小型學習社區計劃」。

你可能會覺得上述做法很有道理。我們很容易從因果關係角度去解釋小規模的院校為什麼可以提供優質的教學。我們認為,比起大規模院校,小規模院校可以給予學生更多的關注及鼓勵,因此能培養出成就卓越的學者。但不幸的是,這樣的因果分析是無意義的,因為得到的結論都是錯誤的。如果那些向蓋茨基金會提交報告的統計學家們調查過最差學校的特點,他們會發現那些較差的學校也比水平一般的學校的規模小一些。事實上,規模小的學校辦學水平並一定更高,他們只不過更懂得變通而已。維納和澤維林說,如果真有什麼區別的話,那就是大規模院校可以提供多種多樣的課程,所以容易收到好的效果,特別是學生能拿到高分。

多虧了幾年來認知心理學的發展,我們現在才能清楚地知道阿莫斯和我所瞥見的不過是冰山一角:小數定律包含在大腦工作的兩個重要部分中。

·誇大對小樣本的信任只是眾多錯覺中的一種—比起信息的可靠度,我們會更加注重信息本身的內容,其結果就是我們會將周圍的世界變得比數據所能證明的更加簡單和統一。在想象的世界中過早下結論比在現實中更有把握。

·統計學家的很多觀察研究都可歸結到因果關係的解釋上,但他們卻不承認是這樣的。許多事實其實只是巧合,包括事件的採樣。對偶發事件作出因果關係的解釋必然是錯誤的。

示例—小數定律
「沒錯,自從這個新執行總裁接手後,電影製片廠已經製作了3部優秀電影。不過,現在說他老練還為時過早。」
「統計學家能夠估算出這個交易新手表現出來的強勁勢頭是否是偶然的,所以在諮詢統計學家之前,我不會相信他就是個天才。」
「觀察的樣本太小,所以不能作出任何推斷。我們不要遵從小數定律。」
「在我們有足夠大的樣本之前,我計劃對實驗結果暫時保密。否則,我們會有過早下結論的風險。」