思考,快與慢:第14章 猜一下,湯姆的專業是什麼? · 1 線上閱讀

請看下面這個簡單的問題:

湯姆是你們國家一所著名院校的研究生。請預測湯姆就讀於以下9個專業的概率,並對專業進行排序。用1表示最有可能就讀的專業,9表示最無可能的。

工商管理

計算機科學

工程學

人文與教育

法學

醫學

圖書館學

自然科學與生命科學

社會科學和社會工作

這個問題很簡單,你馬上就知道不同專業的招生規模是解決問題的關鍵。就你所知,湯姆是從這所大學裡隨機挑選出來的一名研究生,好比從罐子裡隨意拿出來的一個彈球一樣。想要知道這個彈球是紅色的還是綠色的,你必須清楚罐子裡兩種顏色的彈球各有多少。某一特定種類的彈球所占比率被稱為基礎比率。同樣,在這個問題中,人文與教育專業的基礎比率指的就是這個專業的學生人數占全體學生總數的比率。在缺乏與湯姆相關的具體資料的情況下,你可能會根據基礎比率進行猜測,相比計算機科學和圖書館學,湯姆更有可能被人文與教育專業錄取,因為人文與教育專業的招生規模比另外兩個專業的招生規模大。在沒有其他信息可供參考時,採取基礎比率的方法最容易。

接下來的這個任務與基礎比率並無關聯。

一位心理學家在湯姆高三時對他進行了一系列不定效果的心理測試,大體推斷出他的個性,其描述如下:

儘管缺乏創造力,但湯姆智商很高。他喜歡按部就班的簡單生活,喜歡乾淨整潔的環境,屋子裡的物件要擺放得規規矩矩。他寫的文章枯燥,偶爾會寫一些老掉牙的雙關語,或者迸發出類似科幻小說的火花,文章還顯得有那麼點生動。他頗具競爭意識。此外,湯姆待人冷淡,缺乏同情心,也不願與他人接觸。儘管他總是以自我為中心,但卻有強烈的道德觀念。

現在,請拿出一張紙來,按照上文對湯姆的性格描述,預測他與某個專業典型學生的相似度並進行排序。用1表示最相像的專業,9表示最不像的。

如果能夠很快完成這個任務的話,你就會從本章學到更多東西。很有必要讀讀湯姆的相關報告,這會幫助你對不同專業的研究生特質作出判斷。

下面這個問題同樣很直接。它需要你重新獲得或構建一個不同專業領域的研究生的典型形象。在20世紀70年代早期,實驗剛開始進行時,平均結果所呈現的專業順序如下所示。這與你的排序可能並沒有多大不同:

1.計算機科學

2.工程學

3.工商管理

4.自然科學與生命科學

5.圖書館學

6.法學

7.醫學

8.人文與教育

9.社會科學和社會工作

由於會想到書呆子(因為描述中有「老掉牙的雙關語」這一條),你有可能將計算機科學排在首位。實際上,湯姆的性格特徵就是按照計算機科學專業學生的典型形象來描述的。另一個大多數人都排在前面的專業是工程學(描述中有「規規矩矩」這一條)。你可能認為湯姆並不適合社會科學和社會工作專業(因為他「待人冷淡,缺乏同情心」)。但該專業人員的典型形象似乎在我設計描述湯姆實驗後的40年內發生了少許變化。

給這9個專業排序是一項複雜的任務,肯定需要系統2有規則、有秩序地組織,只有這一系統才能完成這項任務。然而,描述所給的提示(老掉牙的雙關語及其他一些提示)很容易激活關於典型形象的聯想,這是系統1控制下的自主活動。

這項尋找相似點的任務要求我們對湯姆的描述和不同專業學生的典型形象進行比較。描述的準確性—無論這是不是對湯姆的真實寫照—與任務的目的沒有關係。另外,你對每個專業基礎比率的了解也與任務無關,因為某個個體與某個組織典型人員的相似性並不受這個組織大小的影響,甚至在大學裡根本沒有圖書館系的情況下,你都可能會將湯姆的性格描述與圖書館學專業的研究生形象進行比較。

如果你再次審視湯姆,會發現他很適合人數少的專業(計算機科學、圖書館學、工程學),並不適合人數多的專業(人文與教育、社會科學與社會工作)。的確,受試者也幾乎都將人數多的兩大專業排在了最後。湯姆被刻意設計成了「反基礎比率」的角色,適合於人數少的專業,不適合人數多的專業。

 

依據典型性作出預測是下意識的行為

第三個排序的任務是由心理學專業的研究生完成的。這項任務尤其重要,同樣是根據湯姆就讀專業的概率對9個專業進行排序。不過進行這次預測的人了解相關的統計學事實:他們對不同領域的基礎比率都很熟悉,也知道對湯姆的性格描述並不十分可信。然而,我們希望他們只關注描述與典型特徵的相似性(我們將其稱為典型性),而忽略掉基礎比率以及對描述的準確性的懷疑。他們將人數少的計算機科學專業排在了最前面,因為這個專業最典型。

在尤金工作的那一年,我與阿莫斯十分賣力,我有時還會在辦公室里通宵達旦地工作。徹夜工作的任務之一就是將典型性和基礎比率之間的衝突描述出來。湯姆的形象就是我努力的結果,我是在清晨時分完成了對他的描述。那天早晨第一個來上班的是我的同事兼好友羅賓·道斯(Robyn Dawes)。他是一個富有經驗的統計學家,也是直覺判斷有效性的懷疑者。如果說有人能意識到基礎比率的話,這個人一定是羅賓。我將羅賓叫過來,給他看了我剛打出來的問題,並讓他猜測湯姆的專業。我至今仍然記得他試着回答時露出的狡黠笑容,他說道:「計算機科學嗎?」那是一個令人開心不已的時刻,我心想:你也有失算的時候啊。當然,我一提到「基礎比率」,羅賓很快就更正了他的錯誤,但他開始並沒有自主地想到這一點。儘管他比任何人都清楚基礎比率在預測中的作用,但當他看到某個人的性格描述時,就會忽略掉這些比率。不出所料,他用對典型性的判斷替代了對概率的評估。

隨後,我和阿莫斯搜集了3所重點院校里114名心理學研究生對這個問題的答案。這些學生都上過幾門統計學課程。結果確實沒讓我們失望。他們對9個專業概率的排序與和典型形象相似程度的排序並無太大差別。在這個實例中,替換起了很大作用:並無跡象表明除了判斷典型性以外,受試者還用了別的方法。因為關於概率的問題較難回答,而關於相似性的問題就比較簡單,所以在回答時受試者就置換了問題。這是一個嚴重的錯誤,因為對相似性和概率的判斷所遵守的並不是同一個邏輯規律。我們對相似性的判斷可以完全不受基礎比率的影響,不受可能會出現的不當描述的影響,但是在判斷概率時,如果忽略基礎比率和證據的可靠性的話,就註定會犯錯誤。

「湯姆是學計算機科學的概率」並不是一個簡單的概念,邏輯學家和統計學家對它的意義各執己見,還有一些人認為它根本就沒有意義。對於很多專家而言,概率是信念主觀程度的評估手段。有些事你確信無疑,例如今天早晨出太陽了;而另外一些事是你認為根本不可能的,例如太平洋突然結冰了。還有許多事會令你半信半疑,例如你隔壁的鄰居是一個計算機科學家—這便是此事在你眼中的概率。

邏輯學家和統計學家相互爭論,提出了多個關於概率的定義,全都非常精確。然而,對於外行人來說,概率(在日常生活中和「可能性」是同義詞)是一個相對含糊的概念,與不確定性、傾向性、貌似正確以及出乎意料等詞緊密相關。模糊性和令人不爽的感覺不都是這個概念所特有的特性。當我們使用「民主」或「美麗」這樣的詞時,我們或多或少明白自己究竟要表達什麼意思,我們的談話對象也或多或少能明白我們究竟想要說什麼。在我潛心研究事件的概率問題的這些年來,從來沒有人舉手問過我:「先生,請問概率指的是什麼?」如果我問他們的是一個奇怪的概念,例如適應全球化的能力,他們肯定就會舉手問問題了。儘管每一個人都表現出他們知道該怎樣回答我的問題,但我們都明白要求他們去解釋這個詞的含義有些難。

被要求作概率評估的人並不會感到很困惑,因為他們對概率的判斷與統計學家或是哲學家的判斷不同。關於概率或可能性的問題引起了思維的發散性,讓人想起比較簡單的問題的答案。其中一個簡單的答案就是對典型(代表性)的自動評估—在我們理解語言時這種現象很常見。「貓王埃爾維斯·普雷斯利(Elvis Presley)的父母曾希望他成為一名牙醫」,這一(錯誤的)陳述聽起來有些好笑,因為我們會自動把貓王的形象與牙醫聯繫在一起,然而這兩者的形象實在相差太大。系統1能使人產生相似的印象,雖然它並沒有刻意這樣做。「她會贏得競選,你明白她肯定會贏」,「他學習成績好不了,看那一身文身吧」,聽到有人這樣說時,他們一定是受到了典型性啟發式的影響。如果我們通過某個下巴的輪廓或鏗鏘有力的演講來判斷這個職位候選人是否具有領導才能,此時我們依賴的就是典型性。

儘管通過典型性作出預測的做法很普遍,但是在統計學上這一做法並不是最優選擇。邁克爾·劉易斯(Michael Lewis)的暢銷作品《魔球》(Moneyball)說的就是這種預測方式的低效性。職業棒球球探在預測某個選手是否會成功時,他們大體上看的是球員的體格和相貌。這本書的主角是奧克蘭「運動家棒球隊」的經理比利·比恩(Billy Beane)。他作出了一個大家都不願接受的決定:否決球探們的建議,通過選手過去表現的統計數據來挑選球員。「運動家棒球隊」挑選出來的選手都以低會費入隊,因為其他球隊都因為沒有想到用數據來判斷,因而拒絕了這些選手。「運動家棒球隊」很快就以低成本達成了最佳結果。