2018年5月19日 星期六

小數據騙局

       這一季第二本書是這本—小數據騙局,其實我本來以為這本書應該很有趣,但是看一看後有點小小失望,記得以前有人跟我說過,在做數據收集前,應該要想好一個預計的結果,數據應該是想辦法輔佐這個想法,但如果結果真不如預期,那也沒關係,就是想錯了而已,千萬不要先找完數據再想理由解釋這些數據,因為不管是什麼東西,都有很多面相,怎麼解釋其實都通,那只會進入一個自己的謬論而已,這本書其實有一點犯了這個錯誤,書裡面有非常多的數據範例,都是以前報導或是政府公佈、解釋的數據,而作者認為當時的解釋「有問題」,所以嘗試用另一個面相去解釋這個數據,雖然是好意,但總覺得有之前說的問題。
      不過看了這本書,也還是可以學到很多,第一就是你可以發現,真的所有事情都有很多方式可以解釋,第二,一個數據出來後,其實真的藏了很多細節,我們應該試著找出越多的細節,而不是只是看表面的結果,例如,我記得以前台灣記者跟政府就常常搞這招,公佈一項「最新數據」,6個月內的圖非常漂亮,好像一直在攀升,但是有人算了標準差後,發現好像有點怪,數據間距及刻度改變後,圖整個大變形,「其實事實是下滑的」,其實可能那篇報導也不一定是錯的,可能短時間真的是有變好,但是其實長時間看來還是下滑的嚴重,這就是數據解讀的差異。
      還有這本書雖然只是數據的解讀,但是還是有分出一些重點,例如,數據應該還是要跟過去比較,而變量應該越小越好。 分析數據時,可以和一些相關的東西一起進行分析,例如我想了解某個年齡層對某樣東西的接受度,如果我只分析這個年齡層,很容易出現誤解,以為這個年齡層真的不能接受這件事,但是可能每個年齡層都拉出來後,會發現,這個年齡層好像是持平的,反而是另一個年齡層拖垮了整體數據。刻板印象應該要先拋棄,如果有刻板映像,就很容易只找那相關的數據出來,而忽略了後面隱藏的「大陰謀」。兩個數據互相牽動時,應該要想辦法確認,到底他們的關係是「因果」,還是「互相影響」...。
      雖然我覺得這本書有犯了很多的問題,畢竟數據分析本來就非常主觀、也非常多面相可以解釋,但是我覺得有一個好處,看這本書可以練習一件事情怎麼用不同角度切入,每一則故事都是先用報導的角度介紹後,才會開始作者的角度介紹,可以練習自己用不同角度看事情,也是一件蠻不錯的事情。

深思快想


        前一陣子看了一本書,叫深思快想,這本書看名字就可以知道是一本訓練思考的書,人在接觸一個新事情時,其實都會默默的把這事情做連結,而一般人只會有基本的連結🔗,例如我們現在要種植植物,會想到要買培養土、肥料,這就是基本連結;少部分人人會把事情跟過往經驗結合,一樣是種植植物,有些人就是想到了,魚大便可以提供肥料給植物、植物行光合作用可以製造出魚要的氧氣,所以就有人做出了「生態瓶」。

        連結越多,思考就可以越深入,而怎麼快速連結,就要平時多多練習了,這本書第一章主要就是在介紹基本的方法,然後後面幾張教一些深入的方法,及提供一些範例練習。
        而要練習深入思考,最重要的第一步就是要學習懷疑的能力,其實人在小的時候都具備這項能力,而這項能力也是最近幾年常常聽到的東西,真的非常的重要,懂得問自己為什麼、懂得怎麼找到答案(有時候答案需要靠自己找出來、有時候需要尋求別人的幫助),但不論哪一個,懂得問自己(或別人)為什麼,懂得尋求答案,絕對是當今社會重要的一項必備技能。當然,有些公司是不需要的,之前聽人說過,並不是每間公司都希望找個「聰明人」,有些公司比較喜歡的是「聽話的人」,但是我覺得當個會思考、好奇的人,和當一個傻傻執行的人,我還是比較喜歡前者。
        在看這本書時,其實我也常常在反思自己有沒有做到,最近幾年在公司的訓練下,我覺得我自己有自信已經做到了7成,但是常常還是覺得不夠深入,果然還是要在多練練,前一陣子去聽一個外部分享,也有提到「連結」的部分,多動動腦、多增加自己連結的能力,對於未來的自己一定有幫助的。