怎樣看穿「做假」的真實數據?

每日微課,關鍵概念、效應、定律和法則

Advertisements

思維技能、學科通識,你的雲知識庫

【導讀】

當某公司在廣告中大言不慚地宣傳他們的牙膏能減少23%的蛀牙時,其實被測試的用戶僅由32個人組成;

當媒體報道稱「1924級的耶魯畢業生平均年收入為25111美元」時,其實問卷的回收率只有5%~10%;

當你自認為住進了一個平均年收入超過10萬的富人區時,其實一半的居民年收入都只有區區2萬元。

我們知道,人們會利用有偏的樣本、精心挑選的平均數、對誤差的忽略來隱瞞一些不太樂觀的事實。這是導致統計數據不真實的其中三個原因,你還知道其他的原因嗎?

【一】

統計圖被「歪曲」

在切入正題前,先來看下面這張圖。

兩個折線圖描述的數據是一樣的嗎 (單選)
0
0%
不是
0
0%

Advertisements

有時候,單靠文字來表達統計結果,很難達到廣告或宣傳的效果,於是人們便利用統計圖的視覺衝擊來達到此目的。你也許會質疑:圖表是很直觀的統計數據,難道還能不真實嗎?下面就來看看精挑細選的統計圖是如何欺騙蒙蔽人們雙眼的。

統計專家大萊爾用一個例子為我們詳細演示了統計圖「歪曲」的過程。

上面這張圖(橫坐標表示的是月份,縱坐標是每月的國民收入)是一個原始的、清晰顯示一年來國民收入變化的折線圖,並且變化是逐月反映出來的。

然而畫圖者很快會發現,整張圖按比例繪製,雖然看上去國民收入的確上升了10%,但是卻不振奮人心。如果你僅僅是利用這個圖來傳遞信息,那麼目的已經達到了,但如果你是希望利用它來贏得一場爭論,渲染效果就遠遠不夠。這時候,你就可以把底部的數據抹去,最後得到下面這張圖的效果:

如果你覺得這樣的增長趨勢還是不夠驚人,那就試試改變橫縱坐標的比例關係,將縱坐標的每一個刻度縮減為原來的1/10,最後得到下面這張圖:

這樣一來,是不是一下子就將原來樸實的10%的增長率看上去比100%的增長率更讓人振奮?

刻意抹去部分數據、改變圖形比例,便是導致統計數據不真實的第四個原因。

調查中左邊的折線圖(標題為:政府支出急劇上升!),就是美國雜誌《Dun』s Review》的某個編輯在1938年時摘錄的,該圖形出現在一則鼓吹華盛頓廣告業的廣告中。但統計圖折線后隱含的數據僅僅從1950萬美元增長到了2020萬美元。

於是該雜誌便利用相同的數據繪製了圖形的另一版本,標題是:「政府支出保持穩定」,此時圖中的折線就客觀地反映了4%的增長率。因此,這兩張圖所描述的內容實際上是一樣的。

【二】

統計資料不完全匹配

什麼叫不完全匹配?簡單來說,就是當人們發現自己想證明某事卻沒有能力辦到時,就會試著解釋其他相關事情,並假裝它們是一回事。而當人們把這樣的統計資料呈現出來后,幾乎沒有人會發現它們的區別。

比如隨處可見的廣告:「經過試驗證明,該榨汁機的榨汁功能增強了26%,並且得到了好管家研究院的推薦。」

功能增強26%的榨汁機,聽起來確實不錯。但這個數據意味著什麼?功能增強了26%的比較對象是什麼?如果只不過是一台老式的手搖榨汁機,恐怕這增強的功能就沒有意義了。

不光是廣告,政府組織為了達到宣傳的目的,也會利用一些毫不相干的數據來迷惑大眾。

在美國與西班牙交戰期間,美國海軍的死亡率是9%,而同時期紐約市民的死亡率是16%。後來海軍徵兵人員就用這些數據來證明參軍更安全。

但是,就算這些數據都是正確的,你是否想過這些數據產生的原因?美國海軍和紐約市民這兩組對象有可比性嗎?海軍主要都是由那些體格健壯的年輕人組成,而城市居民包括了嬰兒、老人、病人,他們無論在哪兒死亡率都比較高。這樣的數據就是沒有可比性的,因此也無法證明符合參軍標準的人在軍隊,比在其他地方有更高的存活機會。

沒有可比性的數據,往往也會扭曲事實。統計資料的不完全匹配,是導致統計數據不真實的第五個原因。

【三】

陷入相關關係的謬誤

有人曾經在探求「吸煙的大學生是否比不吸煙者成績差」這個問題時,費盡周折后發現,結果的確如此。從此,他們便多次使用這個結論進行一些推斷:抽煙使人頭腦變笨;在通往好成績的道路上,需要忍受放棄抽煙帶來的痛苦。

或許得出結論的過程是正確進行的:樣本容量足夠大,並且經過認真仔細的挑選,相關關係也的確十分明顯。但人們沒有考慮到的是,這也許是一個相反的作用關係。

比如,不理想的分數促使學生變得愛抽煙。又或者,兩個因素並不互為因果,而是第三個因素的產物。比如,那些不把讀書當回事、愛社交的學生更偏愛抽煙;性格外向的學生比性格內向者更愛抽煙。但這些說法實在無法令人滿意,所以總是被人忽略。

兩個事物之間的關聯關係,並不能用於說明其中一個將引起另一個的變化。條件不充分的情況下證明出這種關係,就容易陷入相關關係的謬誤,這是導致統計數據不真實的第六個原因。相關關係的謬誤有三種:

由於機緣巧合產生的相關

對於一些幾乎不可能發生的事情,由於偶然,你或許能夠收集到證明其存在的證據,但如果重新收集數據,或許第二組數據就無法證明這個結論了。就像自稱能防止齲齒的牙膏生產商,只要將對自己不利的理論扔到一邊,轉而公開你需要的東西就能達到廣告的效果。

聯合變動

這種關聯關係是真實的,但卻無法確定何為因何為果,有時因果可以不時地交換位置,甚至互為因果。比如,收入和擁有的股票之間便是這種關係:擁有越多的錢,便能買到更多股票,同時,手頭上的股票越多,又可以為你獲取更多收入。

顯著的相關性中,所有變數之間無任何影響

抽煙者與成績的不好就屬於這種相關謬誤。還有一個真實的統計案例,也反映了這種虛偽相關。比如,美國曾經就有人指出,在馬薩諸塞州,長老教會會長的收入與哈瓦那阿朗姆酒的價格之間密切相關。

在這一結論中,誰是因誰是果?我們能得出教會會長從朗姆酒貿易中獲益,或會長支持該貿易的結論嗎?這是否過於牽強?實際上,會長收入和朗姆酒價格還受到了第三個因素的影響,即歷史性或全世界範圍內物價水平的上漲,也會導致收入和價格這兩個數據的增長。

雖然經驗告訴我們「眼見為實」,但眼睛告訴我們的「真相」有時卻會隱瞞或誇大事實。因此,我們必須掌握一些技巧,讓自己不被「科學」的結論所愚弄,從而輕鬆地走出迷宮。

仔細觀察統計圖中的數據

閱讀統計圖時,我們不能把注意力集中在圖形的直觀效果上,而應深究隱含的數據,通過數據的對比得出結論,才不會被看似「驚人」的變化圖所迷惑。

比如【一】中「政府支出急劇上升!」的圖,如果仔細閱讀圖中的數字並進行分析,就能得出「財政支出平穩增長了4%」的結論。但如果只看統計圖,或許你永遠也無法發現,繪圖者為了達到宣傳效果,將縱軸的數據抹去,放大縱軸的比例,單純通過觀察得出的結論就變成了:政府支出急劇上升!

查看引起變化的原因

比如,某個報告得出「最近25年癌症死亡人數增多」的結論,你就要反問:癌症的死亡人數真的有增加嗎?數據中是否遺漏了引起這一變化的原因:以前許多「病因不明」的案例現在已經確診為癌症;屍體解剖成為一種經常使用的方法,因此出現更多確診的癌症病例;醫學統計資料的報告和編製更加全面;易發病年齡段的人數增多等等。

【技巧二】

查看數據中是否被偷換了概念

在分析統計資料時,請留心從搜集原始資料,到形成結論的整個過程中,是否存在著概念的偷換。也就是將看上去極像、而完全不同的兩件事混淆在一起。交通事故死亡人數的增多,不能等同於交通事故死亡率的提高。

比如,對「去年因飛機失事造成的死亡人數比1910年多」這個結論來說,並不意味著乘坐飛機很危險,因為現在選擇飛機作為交通工具的人已經是以前的幾百倍了。

如果你出門遠行前十分關注旅途的安全,那麼詢問去年火車、飛機、汽車哪一種交通方式的意外事故多,並直接比較這些數據來進行判斷是不正確的。只有通過詢問每100萬乘客里程的遇難人數,並進行比較才能確定哪種方式的風險最大。

此外,在相關分析中自命不凡地胡說也是一種偷換概念的手法,即將「相關關係」偷換成「因果關係」

在吸煙和大學生學習成績相關性的案例中,吸煙和低分只是一種相關的關係,但並不是說如果低分緊跟著吸煙出現,那麼吸煙就是導致低分的原因。

「抽煙導致低分」的無根據設想,就是運用真實的相關關係來支持一個未經證實的因果關係。因為這裡的因果關係也可能正好相反,不理想的分數也有可能促使學生變得愛抽煙。另外,導致學生愛抽煙的原因還有可能是諸如性格等的第三個因素。只是這種結果對於宣傳者來說,很難達到積極有效的宣傳效果。

【技巧三】

警惕外推法得來的無意義數據

什麼是外推法?外推是根據過去和現在的發展趨勢推斷未來的一種方法。它是一種很好的近似計算方法。對於已求得的低精度近似值,只要作幾次最簡單的四則運算,便立刻得到高精度的近似值。有時,通過這種方法分析統計數據,並對未來趨勢進行預測而來的結論,往往就會與實際情況相左。

幾年前,美國一家大型電器設備公司就以出生率不斷下降為基礎,高效地制定出了戰後的生產計劃,並將小容量家電設備、公寓式冰箱確定為生產重點。但其中一個計劃者就突然發現計劃與常識的衝突,他用足夠長的圖表列舉了這樣的事實:他本人、合作夥伴、朋友以及他的鄰居都有了孩子,甚至還打算要3~4個孩子,而這個事實機會對所有人適用。

這導致了一些開放式的調查與製圖,不久后,這家公司便快速地將它的生產重點轉移到大家庭使用的電器上,最後才獲得了豐厚的盈利。由此可見,計劃者需要預見實際情況的轉折,並快速調整自己的計劃。

外推法在預測趨勢時其實是十分有用的,但當看到利用外推法計算出來的數據和圖表時,一定要記住的是:到目前為止的趨勢都是事實,而未來的趨勢只不過是受教育者的猜測。該方法暗含「其他所有條件都相同」以及「現有趨勢將繼續下去」的前提。但實際上,條件會一直變化。

作者:精讀君(微信/QQ公眾號:精讀)

Advertisements

你可能會喜歡