讓我們來做一個好玩的遊戲:研究人員把滿滿兩口袋球放在被試者面前,每隻口袋裡都有紅黃兩種顏色的球。一號口袋裡, 75% 的球是黃色, 25% 的球是紅色。二號口袋裡正好相反, 75% 是紅色, 25% 是黃色。你隨機挑選一個口袋,然後把球一個接一個往外拿,其間不得向袋子裡面看。每拿出一個球,你都需向研究人員回報他的猜測:你手中的袋子究竟是黃色球居多,還是紅色球居多?
這是密西根大學沃德・愛德華茲做的研究,主題是:人類在決策制定過程中,如何對新資訊做出反應。
紅球與黃球實驗
實驗的目的不是測試數學計算,而是測試人類對機率的直覺。比方說,你摸出了一個紅球,讓你猜,這個球來自一號口袋還是二號口袋?可能性是多大?聰明如你會說:這很簡單呀,二號口袋裡的紅色球數量比一號口袋裡的多,那這個球來自二號口袋裡的可能性當然更大。然後你又從同一個口袋裡摸了一個球,還是紅色,你可以再根據這個資訊來調整你的猜測。你會想:嗯,這個口袋是二號口袋的可能性又大了一點。接著,你又從該口袋裡摸了第三個球,還是紅色。(以上實驗,應該是每次都把抽出的球放回原處。)
注意,實驗的關鍵問題來了:你覺得摸了三次都是紅色球之後,該口袋是二號口袋的機率是之前估算的多少倍?請你隨便估一下,記在心裡。然後,我們再來看一下當年該研究的結果。
似乎有槓桿效應
當被試從口袋中抽出的是紅色球時,他們更傾向於認為該口袋裡紅色球佔多數。假如他們抽出的前三個球都是紅色,那麼他們認為袋中球以紅色為主的機率就變成了之前的 3 倍。嗯,你看,人是會根據新資訊,對過去的判斷進行更新的。可惜,這個估算差太遠了。實際上應該是多少倍呢?27 倍。(以上案例,來自《思維的發現》,對於倍數表述的含糊之處,我沒有調整。)
這個實驗表明,人們的判斷方向,以及根據新資訊更新判斷的感覺,都是正確的。問題在於:人們低估了更新的幅度。連續摸出三個紅球,令該口袋是二號口袋的可能性,是一號口袋的可能性的 27 倍,而不是我們直覺的 3 倍。(請注意,這裡對倍數表述的依然有點兒含糊,但不影響計算和表達觀點。)
根據上面的計算,如果連續摸出三個紅球,來自二號口袋的機率是 27 /( 1 + 27 )= 96.42% 。這裡面讓人迷惑的是機率疊加。人們對一層機率的感覺還是可以的,但是多層機率相乘,就會有點兒繞不過來。上面這道題,算了三層。
我感興趣的地方,不是計算本身,而是 “ 根據更新的資訊,逼近真相的速度 ” 。也就是貝氏計算的預測能力。大腦在面對資訊時,會有一個加工的過程。這種加工能力,決定了大腦厲害與否,以及一個人能否在現實世界裡做出更聰明的決策。
如上計算,每摸到一個紅球,是二號口袋的機率就會乘上 3 倍。三次的話,就是 3 的三次方,也就是 27 倍。沒錯,這是一個並不複雜的貝氏計算。但是,你發現沒有,這當中,似乎有某種連續的 “ 槓桿效應 ” ,令隨便抽三個球出來,就達到了如此高的預測精度。這,也是厲害的人的思維方式。
槓桿效應的應用
關於槓桿效應,人們也會在金融領域來使用資金槓桿。例如你從事某個高利潤產業,年利潤高達 20% ,於是你到處借錢,願意付出高達 15% 的利息,實現了財富的槓桿效應。然而,一旦你的利潤出現了波動,例如降到了 12% ,負的槓桿效應就出現了。
很多富豪們更是使用了 “ 複式槓桿 ” ——槓桿加槓桿。然而,一切皆有價。於是,我們在新聞上看到,一家百億資產的公司,因為還不起幾千萬欠款,導致了整個商業帝國的倒塌。時間也能起到連續的 “ 槓桿作用 ” 。例如高頻率交易,從那些人們無法利用的、極為短暫的市場變化中尋求獲利,就像鯨魚張開大嘴從大海裡吞食,小魚小蝦肉不多,總量卻很驚人。
槓桿原理還是各種人生道理與成功學的必備良藥。天下沒有免費的午餐,一切皆有價。槓桿原理也是如此,由世界上最聰明的一群傢伙組成的長期資本,將資金槓桿和時間槓桿運用得淋漓盡致,依然因為極小機率事件發生,被反向作用的槓桿原理砸死了。那麼,貝氏思維的 “ 大腦槓桿 ” ,到底屬於哪一種槓桿呢?
說回貝氏的 “ 槓桿效應 ”
1968 年 6 月,天蠍號核潛艇在大西洋亞速海海域失蹤了,潛艇上的 99 名海軍官兵全部杳無音信。看起來是不是像大海撈針?就搜尋的難度而言,的確如此。海軍請來科學家克雷文組織搜尋。首先,克雷文列出一系列能夠解釋天蠍號事故的場景。接著,他組建了一個囊括各方面專家的團隊,讓每個成員提供自己對每個可能場景的發生機率的猜測。在將整個海域被劃分成了很多個小格子,每個小格子有兩個機率值p和q,p是潛艇躺在這個格子裡的機率,q是如果潛艇在這個格子裡,它被搜尋到的機率。每次尋找時,先挑選整個區域內潛艇存在機率值最高的一個格子進行搜尋。如果沒有發現,機率分佈圖則會被 “ 洗牌 ” 一次,搜尋船隻就會駛向新的 “ 最可疑格子 ” 進行搜尋,這樣一直下去,直到找到天蠍號為止。克雷文採用的正是貝氏法,能夠利用有限的資訊進行預測,並且根據搜尋 “ 連續更新 ” 。也就是說,每一次 “ 沒搜到 ” 的遺憾都不會被浪費,也不是簡單被標註為 “ 不在這裡 ” ,而是用於更新調整整體的估算機率。
再回頭看我們開頭的例子:當你從未知口袋裡摸球的時候,儘管你摸的球的數量非常有限,但是新資訊的某種槓桿作用,在連續作用之下,能夠讓你以指數級增加的速度,逼近事物的真相。當我們添加更多的證據,初始的信念會不斷地被 “ 洗刷 ” 。有人把天蠍號潛艇案例視為 “ 群體智慧 ” ,也有人將其視為 “ 試錯法 ” ,其實並不精確。貝氏法,每一次都能利用新資訊(哪怕是失敗的資訊),對原有信念進行更新。這就是槓桿作用。更重要的是,這一過程可以不斷循環,連續作用,從而產生了指數效應。所以,貝氏思維的槓桿,是一種關於 “ 可能性 ” 的槓桿。
機率是觀點的概述
《貝氏方法》一書,開篇就提及了 “ 貝氏思維 ” 的奇怪之處:貝氏思維和更傳統的統計推斷不同,貝氏推斷會保留不確定性。在貝氏派的世界觀中,機率是被解釋為我們對一件事情發生的相信程度。換句話說,這表明了我們對此事件發生的信心。
為什麼在這裡會出現有點兒 “ 唯心論 ” 的主觀與信心呢?對比於貝氏派,頻率派認為:機率是事件在長時間內發生的賠率。比如你一直扔一個標準的硬幣,你得到正面的機率是 50% 。但是,對於天蠍號潛艇失事,歷史上沒有那麼多數據。怎麼辦呢?於是,貝氏派把機率解釋成是對事件發生的信心,也就是說:機率是觀點的概述。
認為機率是主觀的,並不意味著貝氏派是一群主觀的傢伙。相反,他們隨時打算更新自己的觀點。哪怕新的資訊(證據)和自己的信念相反,哪怕消息很讓人惱火,很羞辱自己的智商,貝氏派們也坦然接受。如同傳說中凱因斯說的: “ 當事實改變,我的觀念也跟著改變,你呢? ” 但是他們又不是簡單的見風使舵,他們不會因為新資訊徹底拋棄舊的信念,而是通過一個並不複雜的公式,將所有的資訊整合在一起。
《貝氏方法》對此總結:即便獲得了新的證據,我們也並沒有完全地放棄初始的信念。但我們重新調整了信念使之更符合目前的證據(也就是說,證據讓我們對某些結果更有信心)。通過引入先驗的不確定性,我們事實上允許了我們的初始信念可能是錯誤的。在觀察數據、證據或其他資訊之後,我們不斷更新我們的信念使得它錯得不那麼離譜。
比起 “ 簡單的 ” 的貝氏計算,這些思想的價值才是寶貴的。在我看來,貝氏法,就是一種 “ 大腦槓桿 ” 。
人生也能利用槓桿?
絕大多數成功學,都是基於 “ 頻率派 ” 的統計結果。很不幸,由於樣本量過小,以及沒有 “ 雙盲實驗 ” ,絕大多數成功者的經驗和法則,都沒什麼作用。在現實中,那些極其有限的表面上的確定性,會被茫茫人海和時間長河的不確定性徹底淹沒。“ 頻率派 ” 成功學,其 ” 榜樣 “ 可能只是倖存者偏差。
那對於我們自己呢?假如我們願意承認世界是隨機的,也願意不斷嘗試,用於探索, ” 頻率派 “ 不是很好嗎?可能還是不行。因為:每個人作為樣本而言太複雜,而時光又太短暫。人生的難處,或者說樂趣,都在於不可重複。試驗次數有限,樣本量極少。所以,一個人的成長,最好的方法是基於 “ 貝氏思維 ” 的試錯法。
高普尼克說,貝氏學派認為學習本身很像科學進步的狀況。我們會考量一系列不同的假設對世界如何運作的不同描繪。有些假設可能比其他假設更有可能是正確的,但沒有一個是絕對正確的。當我們說相信一個假設是正確的,我們真正的意思是,到目前為止,這是我們最好的猜測。
高普尼克提及了電腦科學家霍德・利普森的發現:有一種策略是讓機器人去發展自己身體的內部圖像,然後機器人就可以預測如果身體內部或外部發生變化會怎麼樣了。她試圖將貝氏式的孩子的玩耍,與機器學習聯繫起來:在試圖做出任何有用的事情之前,利普森的機器人會以一種傻傻的、隨機的方式開始跳舞,就像在婚禮上喝醉酒的表哥一樣。
但是之後,它可以利用在好玩的跳舞階段收集到的資訊來決定當意外發生時該如何行動。即使工程師們拆除了其中一個機械臂,它仍然可以行走。那個一開始看起來明顯沒有用處的舞蹈將使機器人在以後更加強大。從中,我們大概可以看到波普爾試錯法的身影:
- 提出問題;
- 大膽假設(試探性理論);
- 檢驗證偽(排除錯誤);
- 新的問題。
當我們使用貝氏那個簡單的公式,進而再利用電腦來構建算法,波普爾的 “ 試錯法 ” 就會顯得更加強大。說回如何變成一個更厲害的人,就像阿爾法狗,後來最厲害的版本,已經不需要向人類的棋譜,完全靠自己學習。這不是說不該向更厲害的人學習,只是對AI來說人類的棋譜不夠用了,也用不著了。
簡單而言,用窮盡法,把 “ 天下所有厲害招數全部裝在一起隨時調用 ” 的專家模式,對於AI來說,目前並不管用。對於人類學習的效率而言,可能也是。再厲害的大腦槓桿,也需要一個支點。那個支點,就是你自己。無人能夠替代。
人和人之間的差距到底有多大?
這些差距的本質到底是什麼?我們大概可以總結為:
- 人們在最初的認知、判斷、信念上,不會有太大的差距;
- 厲害的人會不斷根據新的資訊,更新自己的信念;
- 尤其是,當某個人建立了自己的 “ 貝氏算法 ” ,就擁有了 “ 大腦槓桿 ” ;
- 然後,他在某個領域持續使用這種 “ 大腦槓桿 ” ;
- 如此一來,他就有機會實現指數式的成長。
以我自己有限的社會閱歷看,那些特別牛的達人,你與他們接觸,會發現很多時候並沒那麼厲害。例如,對於某個新的問題,你可能會覺得,這傢伙的見識還不如我呢。但是差別也許在於,那個達人在不斷地更新,而你還在洋洋自得,或是在維護自己的英明正確。
例如,我腦海中浮現出幾個達人,你和他聊天,開始的時候,雙方唇槍舌劍。結果不一會兒,你發現他在引用你的話和觀點了,而且一點兒都不會不好意思。
這就是貝氏主義者的特點:資訊是用於更新 “ 自己的信念 ” 的,不管這資訊是自己的,還是 “ 敵人 ” 的。也不管這資訊對自己當下的觀點有利,還是不利。貝氏主義者敢於拋出自己的觀點,也不畏懼質疑和調整自己的觀點。就像賈伯斯,到處罵別人的觀點是狗屎。但是假如回過頭來,他發現那玩意兒很香,賈伯斯敢親口把那坨東西吃下去。所以,人和人之間的差別,不是初始值的差別,而在於 “ 大腦槓桿 ” 的差別,以及是否幸運地在某個領域連續運用 “ 大腦槓桿 ” 。
十條信念
- 世界不是由 “ 對錯 ” 構成的,而是由可能性構成的。
- 哪裡有什麼 “ 一眼看穿本質 ” 的神人,只有厲害的貝氏主義者。
- 而貝氏主義者,善於在某個半徑內連續使用 “ 大腦槓桿 ” ,實現指數式進步。
- 好消息和壞消息是等價的,只要你能有效運用於更新信念。
- “ 大腦槓桿 ” 不是天生的,與智商無關,與哲學和計算有關。
- 我們需要用逐步消除不確定性來接近確定性,而不是用確定性來證明確定性。
- 作為計算 “ 不確定性 ” 的機率,會基於時間和空間進行疊加,從而產生復式的槓桿效應。
- 所謂 “ 長期主義 ” ,是一個不斷證偽的過程,而非不斷自我說服的過程。
- 槓桿原理需要遵守 “ 力矩平衡 ” ,你省了力就要多走路。一切皆有價。當然,類似於齒輪和滑輪,可以實現機械和計算上的自動化。
- 大腦和孩子也許天生就會貝氏。保護好自己孩子般的犯錯勇氣和探索精神。
總之,一個貝氏主義者既不會為自己的堅定信念而獻身,也不會因為對這個世界的懷疑而裹足不前。
《虎嗅網》授權轉載
【延伸閱讀】