思考,快與慢:第17章 所有表現都會回歸平均值 · 1 線上閱讀

我曾經為以色列空軍的飛行教練們講授過關於高效訓練的心理學課程,那次經歷為我帶來了職業生涯中最引以為豪的發現。當時我告訴他們關於技能訓練的一條重要原則:對良好表現的嘉獎比對錯誤的懲罰更有效。不管是對鴿子、老鼠、人類,還是其他什麼動物的研究,都給這個說法提供了證據。

就在我結束了激情洋溢的演說之後,經驗最為豐富的一位教練舉手示意,發表了一番自己的意見。他先是承認獎勵對鳥確實管用,但他認為這不是訓練飛行學員的最佳選擇。他說道:「在很多情況下,我會讚許那些完美的特技飛行動作。不過,下一次這些飛行員嘗試同樣飛行動作的時候,通常都會表現得差一些。相反,對那些沒執行好動作的學員我會大聲怒吼,但他們基本上都會在下一次表現得更好。所以說,別告訴我們嘉獎有用而懲罰沒用,因為事實恰恰相反。」

這條統計學原則我已經講授了很多年,而這一次我從一個新的角度重新認識了它,這的確是一個頓悟的時刻。那個飛行教練是正確的,但同時他也徹徹底底地錯了。他的觀察是精明且到位的:被他表揚之後,很多學員很有可能會表現得很糟糕;懲罰反而會促使他們進步。但是就他的推斷而言,獎勵和懲罰之間是毫無關係的。他所觀察到的就是眾所周知的「回歸平均值」現象,這種現象與表現質量的隨機波動相關。一般來說,只有學員的表現遠遠超出平均值時才能得到這位教練的表揚。但也許學員只是恰巧在那一次表現得很好,而後又變差,這與是否受到表揚毫無關係。同樣,或許學員某一次非同尋常的糟糕表現招來了教練的怒吼,因此接下來的進步也和教練沒什麼關係。這個教練把不可避免的隨機波動與因果解釋聯繫起來了。

這個提議確實引起了反響,不過這些教練對概率預測的代數方法沒什麼興趣。所以,我用粉筆在地上畫了一個靶子。我請房間裡的每一位教練都轉過身去,背對着靶子向裡面接連扔兩枚硬幣。接着我們分別測量了靶子到兩枚硬幣的距離,並寫在黑板上。然後,我們又將這些數據按第一次投擲的距離遠近排列。很明顯,第一次投擲得比較好的人第二次大都做得不好,而第一次沒有投擲好的人第二次大都有了進步。我告訴這些教練,他們在黑板上看到的數據其實和飛行員的表現是一致的:糟糕的表現常常會有提高,而好的表現則會變得糟糕,這跟表揚與懲罰都沒有關係。

那天,我的發現是,那些飛行教練陷入了一個偶然性困局之中:因為當飛行學員表現差時,他們就會受到懲罰,而接下來的進步則很可能為他們帶來嘉獎,事實上懲罰根本就沒有發揮什麼作用。而且,處於這種窘境之中的不僅僅是那些教練。我曾無意中發現了人類環境中一個意義重大的事實:生活給予我們的反饋常常違背常理。因為當別人取悅我們時,我們也會對他好;當別人對我們不好時,我們也會對他產生厭惡之情。然而從統計學角度來看,我們卻是因為對人友好而受到懲罰,因為舉止無禮而得到嘉獎。