可悲的美國大選民調,到底錯在哪?
收藏文章
很開心您喜歡 虎嗅網 的文章, 追蹤此作者獲得第一手的好文吧!
虎嗅網
字體放大


分享至 Line

分享至 Facebook

分享至 Twitter


可悲的美國大選民調,到底錯在哪?

2020 年 11 月 5 日

 
展開

無論拜登能不能依靠郵寄選票實現翻盤從而贏得大選(這種情況大概會是 2000 年重演), 2020 年大選的民調機構都會被後世反覆羞辱。大選前的最後一組民調顯示:拜登在全國領先大約 8 個百分點,在搖擺州領先大約 3 個百分點。無論搖擺州的結果如何,全國形勢已經很明朗了:川普僅僅落後 1.6 個百分點,與四年前相仿。高達 6 個百分點的錯判,簡直是不可饒恕的錯誤。

改進後的民調毫無作用

我們無需指出民調在部分搖擺州錯的有多離譜——認為拜登在德克薩斯州只落後 2 個百分點(導致他錯誤地在此投入大量資源);認為川普在俄亥俄州與拜登是五五開(其實川普乾脆俐落地贏了 8 個百分點);認為拜登在鐵鏽帶的優勢很穩固(其實三個州都處於膠著狀態) 等等……。

總而言之,這是一次民調失敗的總記錄,甚至比四年前的失敗還徹底。四年前,民調機構還可以歸咎於 “十一月驚奇” (FBI重啟電郵門調查),而今年沒有這種驚奇了。過去四年,媒體和民調機構一直在反思自己的錯誤、改進民調取樣方式,事實證明這一切都毫無作用;或許有副作用?

當然,川普還沒有贏得選舉。拜登完全有可能後來居上,依靠郵寄選票險勝。但是,即便如此,民調還是徹頭徹尾地錯了,因為他們期待的是一場 “藍色巨浪” 。某些愚蠢的媒體甚至討論過拜登能不能複製雷根在 1984 年創造的奇蹟,把川普的鐵票統統翻過來。想多了。

538 預測拜登的勝率高達 89% ,顯然是嚴重高估了

民調機構錯在哪?

千言萬語,民調不可靠,誰信民調誰就傻了。那麼,民調到底錯在哪裡了呢?換句話說,民調機構究竟應該如何改變,才能避免再次被羞辱呢?

我做過很多草根市調研究,其中既有成功的,也有失敗的。讓我印象最深刻的一場失敗發生在四年多以前,恰恰是川普第一次選舉前三個月。當時我就職於某外資投行,往返於北京和香港之間,看著一大堆可靠或不可靠的A股+港股小股票。我的這個老東家有一個引以為傲的下屬機構,叫做 “證據實驗室”。這個下屬機構的主要職能是透過線上市調研究、線下訪談等方式,提供第一手的資訊,從而指導投資決策。一般投資者獲得資訊的方式,無非是去上市公司拜訪、讀財報、找專家諮詢等;這些全部是 “自上而下” 的市調研究方式。

老東家在全球每個主要國家都設立了 “證據實驗室” ,據說在中國就涵蓋了全部一二線城市和部分三線城市,能夠提供 “自下而上” 的寶貴資訊。我得知這個消息的時候非常興奮,迫不及待地想讓它為我服務。但是,等了半年才輪到我。因為這樣的下屬機構非常昂貴,搞一次涉及幾萬人的問卷調查要投入幾十萬(人民幣,下同)乃至上百萬費用,還要涉及數十名全職或外包員工,所以流程非常緩慢。經過半年鍥而不捨地申請,我終於獲准利用它對中國的電影產業進行市調研究。

令人大開眼界的民調

當時是 2016 年二季度,電影市場從高速公路成長驟然轉入下滑軌道,所有人都想知道:究竟發生了什麼?這種下滑是暫時的嗎?電影產業還值不值得投資,如果值得,那麼應該下注哪些公司?“證據實驗室” 花了三個月進行了大範圍問卷調查,涵括了來自所有省會城市和部分三線城市的上萬名消費者。我在當年 7 月拿到了結論,令我大開眼界:

  1. 大部分受訪者表示,未來半年會提高去電影院的頻率,而且認為電影是自己生活不可或缺的一部分。
  2. 絕大部分受訪者並不認為現在的電影票價偏貴,而且可以接受 10 至 20% 的票價上漲。
  3. 超過半數受訪者表示,相比好萊塢電影,他們更喜歡中國國產電影,而且愛看各式各樣的中國國產電影。
  4. 幾乎所有受訪者都表示,串流媒體和短影片的普及不會影響他們對線下看電影的興趣。

根據上述資料,毫無疑問,中國電影產業將在半年內經歷一波反彈,觀影人數和票價都可以上升,中國國產片的市場佔有率也可以上升……。你還能找到比這更樂觀的產業嗎?說實話,這個結論樂觀得太過分了,但是我覺得,既然這個機構花了這麼多錢、這麼多時間,用科學方法做了這麼一個科學調查,那麼總不可能是錯的吧?至少方向正確吧?

無論最終結果如何,民調肯定是錯的離譜了,於是我以上述民調數據為基礎,撰寫了一系列唱多中國電影產業的研究報告。今天回想起來,我恨不得穿越回去徹底撕毀報告草稿——簡直是丟人現眼。直到 2017 年 8 月(整整一年以後),電影市場才觸底反彈,而且迄今也沒有恢復過 2013 年至 2015 年的驚人成長。電影票價多年沒有上漲,觀影人次成長非常緩慢;中國國產電影的市場佔有率在 2017 年上半年暴跌了一波,錯的相當徹底。

不為人知的瑕疵

此後的四年,我一直在捫心自問:到底哪裡錯了?為什麼幾乎在每個問題上都錯了?事實上,我應該在閱讀原始數據時,就發現一些疑點,足以證明這次民調有嚴重瑕疵:

  1. 大部分受訪者表示自己平均每月去一次電影院。這是不可能的:當年中國人均每年觀影只有 1 次,在一線城市也只有 4 次。平均每月看一次電影,就算在美國的大城市也不可能發生。
  2. 大部分受訪者表示自己最經常使用 “淘寶電影” (即淘票票)購買電影票,比例遠遠超過了淘票票官方公佈的數字。有可能他們根本沒有認真回答問題。
  3. 被問及 “你喜歡看哪些類型的電影” 時,許多受訪者勾選了全部選項,或者至少勾選了大部分選項。消費者會愛看一切類型的電影嗎?不是調查方法有問題,那就是數據源頭有問題。

民調的可悲之處

後來我又做過一些類似的民調。慢慢的,我發現了民調這種市調研究方法本身就是有問題的。無論由誰去做民調,無論用什麼科學手段做,都不能消除民調本身的巨大劣勢。讓我總結一下民調的可悲之處:

首先,受訪者往往不會認真對待民調。試想想,你在吃飯或看電視時接到一個電話,詢問你更支持川普還是拜登,或者你平均多久去一次電影院;你有多高機率認真回答?可能你會憑印象隨便說個答案,可能你會惡作劇地說個假答案。在這種 5 至 10 分鐘的短暫交流中,你會透露什麼心聲嗎

其次,受訪者的回答受到了調查者的明確影響。例如,在那次失敗的 “電影產業民調” 當中,我們的問卷措辭比較樂觀;從設計者到執行者,大家內心裡都是希望電影產業實現良好成長的(否則還怎麼賺錢)。這種樂觀的潛意識傳導給了受訪者,他們不願讓我們失望,就給出了讓我們滿意的回答。就像你接到一個電話: “請問您支持拜登還是川普呢?” 從民調機構的名字中,你知道他們高機率是希望拜登贏的,所以你就順著他們回答了。

再次,受訪者在潛意識裡都不希望被 “孤立” ,或者被視為 “低人一等” 。例如,在電影票價的問題上,他們會想: “如果我說 30 塊錢的電影票太貴了,不等於承認自己很窮嗎?” 在中國國產片與好萊塢影片較量的問題上,他們會想: “自稱愛看中國國產片,是不是會顯得更支持國貨、更正確呢?” 雖然市調研究員不會進入他們的日常生活,但是潛意識仍然會阻止他們說出真話

我自己的微信朋友圈就是一個現成的例子:絕大部分人都沒有任何在拼多多(中國販售便宜貨品牌)買的東西,但是 1 / 4 的人關注了拼多多的微信大眾號(說明至少使用過一次拼多多小程式)。絕大部分人都自稱工作很忙、不玩遊戲,但是有一半人出現在了《王者榮耀》遊戲號的排行榜當中。

說到底,對於金融圈或網路的專業人士來說,玩遊戲會有玩物喪志、不務正業的嫌疑,而在拼多多買便宜貨則對個人經濟形像不利。所以大家都默契地選擇了不去宣傳。

總統大選還是要透過訴訟決勝

自從 2017 年以後,我從來沒有使用過民調這個工具。我覺得,可靠的草根市調研究方式有兩個:第一是以爬蟲、衛星圖、大數據等純粹的技術手段,去獲得 “客觀” 的數據;第二是以一對一訪談、喝茶乃至喝酒聊天等手段,去獲得 “深度的” 認識。民調則兩頭落空,既不客觀又不深度。

用專業手段進行的大範圍民調可能還有一點參考價值,用業餘手段進行的不科學民調則一無是處(甚至有負作用)。我還記得 2019 年 11 月,某券商分析師組織了 50 名同事品嚐瑞幸咖啡,得出了 “大部分人喜愛瑞幸咖啡口味” 的民調結論。我不知道樣本數僅僅為 50 人的民調有什麼參考意義……。

不過,我們還需要正視並回答一個問題:

在 2016 年以前,民調對總統選舉的預測大致還是有用的,誤差不會特別大。為什麼 2016 年以來就變得如此離譜了呢?我覺得這個問題得分兩方面回答。我不是統計學與心理學方面的專家,我只能根據我的主觀感受提供一些備選答案:

  1. 隨著社交網路的崛起,人們的社交圈子大幅擴展了,社交頻率也大幅提升了。無論你在社群平台還是推特,你都是在 “社交” 。所以,人們對於 “社交孤立” 乃至 “社會化死亡” 的恐懼也與日俱增。人們越來越不願意表達與主流觀點相悖的觀點,這種本能已經刻在了人們的腦海深處。這就是成千上萬的 “沉默的川普粉絲” 選擇沉默的主要原因。
  2. 川普是一個非常特殊的候選人,他的人設和行為邏輯都是前所未有的。因為他是一個特異點,所以在制定關於他的調查問卷時要特別小心,詢問的時候也要特別小心。因為民調機構從來沒有理解過川普這個人以及他代表的利益,也就永遠無法正確地做調查。

虎嗅網》授權轉載

【延伸閱讀】

 
週餘
 
 
分享文章
分享至 Line
分享至 Facebook
分享至 Twitter
收藏 已收藏
很開心您喜歡 虎嗅網 的文章, 追蹤此作者獲得第一手的好文吧!
虎嗅網
分享至 Line
分享至 Facebook
分享至 Twitter
地圖推薦
 
推薦您和本文相關的多維知識內容
什麼是地圖推薦?
推薦您和本文相關的多維知識內容