思考,快與慢:附錄A 不確定性下的判斷:啟發法和偏見 · 1 線上閱讀

(本文首次刊登於1974年的《科學》雜誌上,第185卷。美國國防部高級研究計劃局為此項研究提供了支持,海軍研究辦公室也與位於尤金的俄勒岡研究院簽訂了合約,監督該研究。另外,該研究還得到了位於以色列耶路撒冷的希伯來大學研究與開發部門的支持。)

我們所做的許多決策都是基於對不確定事件概率的信念,這些不確定事件包括選舉結果、被告的內疚感或是美元的未來價值。這些信念通常被表述為「我想……」「概率是……」「它是不可能的……」等。對於不肯定事件的信念有時還能以概率或主觀概率等數字形式表現出來。那麼,是什麼決定了人們的信念?

人們又是怎樣評估不確定事件的概率和不確定數量的價值呢?本文將會告知你們,人們依賴於數量有限的啟發式原則,而這些原則能將測量概率以及預測價值的任務簡化,使其成為更為簡單的判斷過程。總的來說,這些啟發法相當有用,但有時也會導致嚴重的、系統性的錯誤。

對概率的主觀評估與對距離或大小等物理量的主觀測量相類似。這些判斷都依賴於效度有限的數據,是根據啟發式的規則進行的。例如,某物體的距離取決於其清晰程度。物體看上去越清楚,其距離就顯得越近。這條規則有一定的效度,因為在任何給定的情境中,距離較遠的物體都會比距離較近的物體更不清楚。然而,對這條規則的信賴會導致我們在測量距離的過程中產生系統性錯誤。特別是在能見度較低時,物體輪廓就會模糊,而其距離就常常會被高估。另一方面,在能見度較高時,物體輪廓就會清晰,其距離也就會被低估。因此,如果依賴於清晰度,將清晰度作為測量距離遠近的標尺的話,就會導致普遍的偏見。這樣的偏見在對概率直覺性的判斷中也會出現。本文將描述三種應用於判斷概率和預測價值的啟發式,列出由這些啟發式引起的偏見,並討論這些偏見的實際應用和理論內涵。

 

代表性

人們考慮的許多概率問題都包含在以下某個類型當中:物體A屬於類別B的概率是多少?事件A起源於過程B的概率是多少?過程B引起事件A的概率是多少?人們在回答這些問題時,會典型地依賴於代表性啟發法,即通過用A來代表B,也就是通過比較B與A的相似程度來對概率進行評估。例如,如果A能高度代表B,人們就會認為A源自B的概率高。但如果A與B並不相似,人們就會認為A源自B的概率低。

若想通過代表性對判斷進行闡述,請考慮下面這個情況,若有某個人被他原來的鄰居描述為:「史蒂夫非常靦腆,少言寡語,很樂於助人,卻對他人或這個現實世界沒多大興趣。他謙恭有禮,做事井井有條,中規中矩,關注細節。」人們如何從一個可能的職業列表中(例如農民、售貨員、飛行員、圖書管理員或是醫生)評估他從事某個特定職業的概率?又如何根據可能性的大小來將這些職業進行排序呢?在代表性啟發法中,例如,史蒂夫是個圖書管理員的概率是通過其與典型的圖書管理員形象的代表性或相似性來進行評估的。事實上,對於這類問題的研究已經表明,人們對職業概率的排序與對職業相似性的排序方法完全是相同的。而這種關於概率的判斷方法會導致嚴重的錯誤,因為相似性或代表性不會受到某些因素的影響,而這些因素卻能影響對概率的判斷。

對結果的先驗概率(prior probability)不敏感。對代表性沒有任何影響而對概率有重要影響的其中一個因素是結果的先驗概率,或基礎比率。例如,在史蒂夫的那個例子中,在我們作出史蒂夫是個圖書管理員而不是農民的理性評估時,是應該將農民比圖書管理員人數更多的事實考慮在內的。然而,對基礎比率的考慮並不會影響史蒂夫與圖書管理員以及農民的典型形象的相似性。因此,如果人們通過代表性來評估概率,先驗概率就會被忽視掉。我們在運用了先驗概率的實驗中檢驗了這個假設。在實驗中,我們向受試者簡要概述了幾個人的性格,這幾個人是從100位工程師及律師的樣本中隨意抽取出來的。而受試者需要通過對每個人的描述來評估其是工程師還是律師。在某個實驗情境中,受試者被告知這些被描述的100人中,有70位工程師、30位律師。而在另一個實驗情境中,受試者被告知這100人中,有30位工程師、70位律師。在第一種情境下,受試者判斷任意一個描述是關於工程師的而不是關於律師的概率都應該高於第二種實驗情境。因為第一種情境中工程師更多,第二種情境中律師更多。值得注意的是,我們通過貝葉斯定理還能知道每個描述的概率比率應該是(0.7/0.3)2,或是5.44。然而,這些受試者在這兩個實驗情境中都得出了同樣的概率判斷,這嚴重違反了貝葉斯定理。很明顯,受試者認為某個特定的描述是在說工程師而非律師是通過描述對於這兩個典型職業的代表程度而來的,而很少或根本就不考慮其所屬類別的先驗概率。

當這些受試者沒有其他信息來源時,他們會正確地利用先驗概率。在沒有人物描述的情況下,受試者判斷某個人是工程師或律師的概率分別是0.7和0.3,這與基礎比率正好符合。然而,當某個描述存在,就算這個描述沒有任何信息,先驗概率還是會被徹底忽略掉。對於以下描述的回應就闡明了這個現象:

迪克是位30歲的男性,已婚,但無子女。他能力強,幹勁足,承諾一定要在自己的領域功成名就。他很受同事的歡迎。

這個描述所傳達的信息與迪克是工程師還是律師的問題完全沒有關係。因此,迪克是工程師的概率應該與工程師占樣本總人數的比率相同,就如同我們沒有得到任何有關迪克的描述時一樣。然而,受試者卻將迪克是工程師的概率判斷為0.5,並不關注工程師占總人數的比率是0.7還是0.3。很明顯,在沒有任何證據和得到了一些無用的證據之後,人們的回應是不同的。在沒有任何特定證據的情況下,先驗概率能夠被合理地應用;而在得知一些無用證據的情況下,先驗概率就會被忽略。

對樣本大小的不敏感。在某個指定大小的樣本中,評估獲得某個特定結果的概率時,人們總會應用代表性啟發法。即他們會通過某個樣本結果與相關參數的相似性來評估這個結果的概率。例如,人們會認為隨機抽取的10位男性的平均身高是6英尺,而這個結果就是由與相應參數(這個參數即是男性人口的平均身高)的相似性得來的。某個樣本的統計數據與人口參數的相似性並不是由樣本的大小來決定的。其結果就是,如果我們通過代表性來評估概率,判斷出的某個樣本的統計數據實質上就是獨立於樣本大小的。的確,當受試者評估大小不同樣本的平均身高分布時,他們得出的分布是相同的。例如,人們在評估平均高度高於6英尺的概率時,無論樣本大小是1 000、100還是10位時,其得出的分布都是相同的。另外,即使樣本大小的重要性在問題形成之時就被強調過,受試者還是不能體會其所起的作用。請考慮下面的問題:

某個城鎮有兩家醫院。在較大的那家醫院裡,每天大約有45個嬰兒降生,而在較小的醫院裡,每天有15個嬰兒降生。如你所知,其中50%的嬰兒應該是男嬰。然而,男嬰實際的百分比每天都會有所變化,有時會高於50%,有時會低於50%。

在一年的時間裡,每家醫院都記錄了新生嬰兒中男嬰比率大於60%的天數。你認為,哪一家醫院記錄的天數更多?

更大的醫院(21)

更小的醫院(21)

大致相同(其天數的不同在5%的範圍內,53)

括號中的數值表示的是選擇該答案的大學生人數。

無論是大醫院還是小醫院,多數受試者判斷出的60%以上新生兒是男嬰的概率都是相同的。這可能是因為這些事件都來自於同樣的統計資料提供的描述,因此關於總體情況的代表性相同。相反,以樣本理論進行分析的話,在小醫院裡,超過60%的嬰兒是男嬰的天數肯定應該比大醫院的多,因為大樣本的男女比率不太可能偏離50%。很明顯,這個統計學的基本概念與人類的直覺不相符。

在對後驗概率(即從一個整體而不是另一個整體中抽取樣本的概率)的判斷中,人們對樣本大小的問題也不是很敏感。

請考慮下面這個例子:

想象有個裝滿球的罐子,其中有2/3的球是一種顏色,1/3的球是另一種顏色。某個人從罐子裡取出了5個球,發現有4個是紅色的,1個是白色的。另一個人取出了20個球,其中有12個是紅色的,8個是白色的。這兩個人中,誰更會認為罐子裡2/3的球是紅色的,1/3的球是白色的?每個人給出的概率各是多少?

在這個問題中,假設兩次抽取的先驗概率相同,那對於4∶1的那個樣本來說,其正確的後驗概率應為8 ∶1;而對於12∶8的樣本來說,其後驗概率為16∶1。然而,大多數人卻認為第一個樣本為罐子裡主要是紅球的這個假設提供了更為有力的證據,因為第一個樣本的紅球比例要比第二個樣本的高。這再次證明了,直覺性判斷由樣本比例主導,本質上並不受樣本大小的影響。然而,樣本大小卻對實際的後驗概率起着至關重要的作用。此外,對後驗概率的直覺性評估比起正確的值來說並沒有那麼極端。在這類對概率的評估中,低估證據的影響反覆出現。這種情況被稱為「保守主義」。

誤解機會。人們期望由隨機過程產生的事件序列能夠代表這個過程的基本特徵,即使這個序列很短。例如,人們在考慮拋硬幣看正反面的問題時,總會覺得其順序更可能是正—反—正—反—反—正,而不是正—正—正—反—反—反,因為後者並不能體現出拋硬幣的公正性。因此,人們期望過程的基本特徵不僅表現在整個序列中,還表現在局部的序列中。然而,局部代表的序列系統地脫離了概率的期望:因為局部代表的序列中選擇很多,但可供選擇的項卻很少。抱有局部代表性這個想法的另一個後果就是有名的賭徒謬誤。例如,在看到輪盤賭的指針長時間連續指向紅色以後,大多數人就會錯誤地認為現在該是指向黑色的時候了。這是因為,相比再次出現紅色,出現黑色會使序列更具代表性。人們普遍將概率視為可進行自我糾正的過程。在這個過程中,某個方向的偏離能引起其相反方向的偏離,以達到恢復平衡的目的。事實上,在概率的結果揭曉之時,偏離並不是被「糾正」了,而只是融為一體了。