這一季第二本書是這本—小數據騙局,其實我本來以為這本書應該很有趣,但是看一看後有點小小失望,記得以前有人跟我說過,在做數據收集前,應該要想好一個預計的結果,數據應該是想辦法輔佐這個想法,但如果結果真不如預期,那也沒關係,就是想錯了而已,千萬不要先找完數據再想理由解釋這些數據,因為不管是什麼東西,都有很多面相,怎麼解釋其實都通,那只會進入一個自己的謬論而已,這本書其實有一點犯了這個錯誤,書裡面有非常多的數據範例,都是以前報導或是政府公佈、解釋的數據,而作者認為當時的解釋「有問題」,所以嘗試用另一個面相去解釋這個數據,雖然是好意,但總覺得有之前說的問題。不過看了這本書,也還是可以學到很多,第一就是你可以發現,真的所有事情都有很多方式可以解釋,第二,一個數據出來後,其實真的藏了很多細節,我們應該試著找出越多的細節,而不是只是看表面的結果,例如,我記得以前台灣記者跟政府就常常搞這招,公佈一項「最新數據」,6個月內的圖非常漂亮,好像一直在攀升,但是有人算了標準差後,發現好像有點怪,數據間距及刻度改變後,圖整個大變形,「其實事實是下滑的」,其實可能那篇報導也不一定是錯的,可能短時間真的是有變好,但是其實長時間看來還是下滑的嚴重,這就是數據解讀的差異。
還有這本書雖然只是數據的解讀,但是還是有分出一些重點,例如,數據應該還是要跟過去比較,而變量應該越小越好。 分析數據時,可以和一些相關的東西一起進行分析,例如我想了解某個年齡層對某樣東西的接受度,如果我只分析這個年齡層,很容易出現誤解,以為這個年齡層真的不能接受這件事,但是可能每個年齡層都拉出來後,會發現,這個年齡層好像是持平的,反而是另一個年齡層拖垮了整體數據。刻板印象應該要先拋棄,如果有刻板映像,就很容易只找那相關的數據出來,而忽略了後面隱藏的「大陰謀」。兩個數據互相牽動時,應該要想辦法確認,到底他們的關係是「因果」,還是「互相影響」...。
雖然我覺得這本書有犯了很多的問題,畢竟數據分析本來就非常主觀、也非常多面相可以解釋,但是我覺得有一個好處,看這本書可以練習一件事情怎麼用不同角度切入,每一則故事都是先用報導的角度介紹後,才會開始作者的角度介紹,可以練習自己用不同角度看事情,也是一件蠻不錯的事情。






