思考,快與慢:第21章 直覺判斷與公式運算,孰優孰劣? · 3 線上閱讀

值得慶幸的是,隨着運算法在生活中適用範圍的不斷擴大,人們也在慢慢接受它。我們在尋找喜歡的書籍或音樂時,會接受軟件推薦的選項;我們理所當然地認為人為因素並沒有影響信貸限額的決定;我們也越來越習慣那些以簡單的運算法形式出現的指導方針,比如說我們應該努力將有益和有害的膽固醇水平維持在什麼比例。公眾現在已經意識到,在體育界公式能比人做得更好:一個職業球隊該給新隊員開多少薪水,或者在第四節的什麼時候該踢凌空球。隨着運算法使用範圍的擴大,大多數人第一次接觸米爾在他那本「讓我煩惱的小書」中提到的結果模式時,他們的不適應感最終必將會降低。

 

「閉上眼睛」的直覺判斷比主觀判斷更可取

1955年,作為以色列國防軍中一個21歲的陸軍中尉,我接受指派為全軍建立一套測試系統。你也許會驚訝為什麼會將如此重任交給我這麼年輕的人,但請記住,以色列當時建國才7年,國內所有的機構都在籌建當中,必須有人去建設。今天聽來有些奇怪,我的心理學學士學位竟然能夠證明我有能力成為軍中最訓練有素的心理學家。我的頂頭上司是一個才華橫溢的研究者,他擁有化學學士學位。

當我接到任務時,例行面試已經準備就緒。每一個入伍的士兵都要完成一系列心理素質測試,對那些有作戰任務的士兵要進行個性評估。我們的目標是要給這些新兵對作戰適應性打一個分,並在步兵、炮兵、裝甲兵等兵種中給他們選擇一個最適合他們個性的兵種。面試官們本身也是新兵,之所以被選中做面試官是因為她們智商高,喜歡與人打交道,她們中的大多數人是當時不必參戰的女兵。經過幾周培訓後,她們學會如何安排一個15~20分鐘的面試,培訓人員還鼓勵她們要覆蓋多個話題,而且要儘量對被測試者日後在軍中的表現情況形成一個整體的印象。

不幸的是,接下來的評估已經顯示這種測試過程對預測新兵日後成功與否毫無用處。於是他們要求我設計一個更有用但不會更耗時的測試。他們還要求我設計新的面試方法,並評估這個方法的準確性。從專業角度來講,這些任務的難度與讓我建一座橫跨亞馬孫河的大橋差不多。

幸運的是,我讀過保羅·米爾那本一年前出版發行的「小書」。我很相信書中的論證,認為簡單的運算法優於臨床的直覺判斷。我總結出,當前的面試之所以失敗,部分原因是它允許面試者按照個人的喜好作決定,這個決定會因面試者的心理活動而發生一些變動。相反,我們應該用限時的項目來獲得受試者在正常環境下更具體的信息。我從米爾那裡還學到了我們應該摒棄這種用面試者的整體評估來給新兵打分的方法。米爾的書中指出這種評估不值得相信,而運算法從分散的評價中得出的結果則更有價值。

我決定採用這樣的過程,面試者要評估幾項相關個性特徵,為每項單獨打分。最後的作戰適應性結果由計算機根據一個特定的公式給出,面試者不干預。我列了一個表格,其中包含與作戰表現相關的6個特點,包括責任心、社交能力以及男子氣概等。之後我再針對每個特點整理出一系列關於他們入伍之前生活的問題,例如之前做過幾份工作、工作和學習時是否準時、和朋友交往的頻率,以及他的興趣愛好和參加過的運動等。這便使我能儘量客觀地從每個角度對新兵進行評估。

通過這些標準化的真實問題,我希望能夠排除光環效應,排除人們喜好的第一印象對判斷結果的影響。為了進一步預防各種光環的影響,我要求面試官依照固定的順序去測試這6個特點,在測試下一個特點之前要對前一個特點按5分制打分。我告訴他們不要為新兵在部隊的未來發展操心。他們唯一的工作就是找出與新兵的過去相關的信息並以此來給每一個特性打分。「你們的作用就是提供可靠的測定值,」我說,「處理預測有效性的工作讓我來。」我這句話的意思是我要用公式來整合他們的具體得分。

面試官們齊聲抗議這種安排。這些優秀的年輕人對我這個和他們差不多大的中尉的命令有點不情願,畢竟這樣的要求禁止他們運用直覺,將注意力完全放在一些無聊的真實問題上。其中一個人抱怨說:「你在把我們變成機器人吧!」所以我妥協了,「按照要求進行測試吧,」我說,「請完全按照要求來進行測試,測試完後,就像許願那樣閉上眼睛,將新兵想象成一個戰士,並給他打分。

我們對幾百次面試都採用了這個新方法。數月之後,我們收集了新兵指揮中心對他們表現的評價,這使我們很欣喜。正如米爾的書中提到的那樣,新的測試過程比原來的過程有質的飛躍。雖然離完美還有一定差距,但6項指標整合起來作出的預測比之前的整體評估要準確得多。我們已經從「徒勞」進步到了「有效」。

面試官「閉上眼睛」後的直覺判斷也很準確,甚至和整合6項指標得到的運算結果一樣準確,這是我最為驚喜的地方。我從這一發現中學到了畢生難忘的一課:即使是不那么正規嚴肅的遴選面試,直覺也會起到積極作用,當然前提是按照規定收集客觀信息並對不同特性進行獨立評分。我建立了一個給予「閉眼」評估和整合6項指標同等權重的公式。從這件事中我學到一個普遍規律:不要簡單地相信直覺判斷—無論是你自己的還是他人的—但也不要完全拋開它。

45年後,我獲得了諾貝爾經濟學獎,在以色列一時間也小有名氣。在一次訪問中,一些人想帶我看看舊時服役的軍事基地,那裡依然矗立着測試新兵的房子。有人把我介紹給心理組的司令部官員,她向我介紹了目前的測試方法,和我當時設計的沒有什麼兩樣。在那裡,大量研究顯示該測試依然有效。最後在介紹如何引導面試官時,她補充道:「我們告訴他們,『閉上你們的眼睛』。」

本章的內容已經在部隊人力測試以外的項目中也得到了應用。按照米爾和道斯的原則進行的測試過程相對來說不怎麼費力,但卻相當嚴格。設想你要為你的公司招聘一名銷售人員。如果真的想選擇最合適的人選,那麼你應該這樣做:首先,選擇一些這個崗位要求的先決條件(比如技能熟練程度、個性穩重程度、可靠性等)。不要列太多,6個左右即可。這些條件最好相對獨立,同時要保證你通過一個問題就能夠對這幾個條件進行評估。下一步就是為每個條件都列出一些問題,並想好如何對其進行評估,分數為1~5分。你應該清楚什麼情況「最弱」,什麼情況「最強」。

作這些準備大約需要半個小時,這種很小的投入能保證你招聘到的員工的質量。為了避免光環效應,你必須在一定時間內完成某一個特性的信息採集並對其打分,之後才能測試下一個。不要越過某個特性去測其他項目。評估每個候選者時,要將這6項評分累加起來。由於你要負責作出最終決定,那就不要「閉眼」測試了。即使你認為其他候選人更合適,也一定要雇用那個得分最高的人—請儘量克制自己創造「斷腿」機會改變排位的想法。大量的研究可以向你保證:只要按照該過程操作,你就能找到最合適的人選。這比人們通常用的那些沒有準備就開始面試,並依靠「我看到了他深邃的眼神,我喜歡自己看到的一切「這類主觀判斷要好得多。

示例—人工判斷和公式運算
「不管何時,只要公式能替代人工判斷,我們至少應該考慮一下(運算法)。」
「他認為自己的判斷既縝密又微妙,但實際上把一些分數簡單地整合在一起也許會更勝一籌。」
「我們應該事先考慮清楚自己有多重視這些候選者以往的表現,否則,對他們的第一印象會對我們產生過多的影響。」