如果你要統計學家說說統計學上有趣的矛盾結果,他們通常會提到辛普森悖論(Simpson’s paradox)〔原注:辛普森悖論是皮爾森(Karl Pearson)和尤爾(Udny Yule)提出的,因此也正說明了史蒂格勒的命名定律(Stigler’s law of eponymy):沒有一個科學發現是以原發現者的名字來命名。這個命名定律則是莫頓(Robert Merton)提出的只要數據當中由交絡變數造成的明顯趨勢,可以藉由數據的自然分組來消除或是翻轉,就會產生「辛普森悖論」。有很多例子,我們就從最通俗的開始看起。

 

加州大學柏克萊分校在1973年收到了一萬兩千七百六十三件研究所申請,而在該學年的申請入學過程中,男生的錄取率為44%,女生的錄取率只有35%。校方擔心被指控性別歧視,要幾位教員仔細檢查數據。〔原注:這段故事的標準版本則稱該校當時被指控歧視,但沒有人說是誰提出控告或是後來結果如何。《華爾街日報》曾採訪一位參與過最初調查的統計學家,這篇訪問顯示訴訟未曾發生。光是擔心被提告,就足以展開調查了。不過,吃上官司的故事流傳已久,大家普遍認為確有其事。〕

 

研究所申請入學與大學部不同,是由各學院獨立作業,最初的調查產生一個自相矛盾的結論:在柏克萊的一百零一個獨立研究系所當中,只有四個系所顯現出具統計顯著性的歧視女性,但同時有六個系所則顯現是歧視「男性」,而且還足以抵消那四個系所產生的女生人數差額。

 

明明個別系所普遍沒有性別歧視,怎麼會整體看來變成有歧視女性?原來是男女生申請各學院的比例不同造成的。例如英語系的申請入學者有三分之二是女生,而機械工程系的申請者只有2%是女生。此外,有些研究所比其他系所篩選得更嚴格。

 

這兩個因素解釋了大家察覺到的性別歧視。女生申請的學院多半有很多符合資格的申請者,經費卻很少,而男生申請的學院申請人數較少,但研究經費過剩。這種偏差不在於柏克萊,因為各系所普遍是公平的,問題出在更源頭的教育過程:女性被送進研究所入學機會較少的學習領域。

 

辛普森悖論在1986年一項關於腎結石清除手術的研究中再次出現。該項研究分析了上百份醫療紀錄,似乎顯示經皮腎造瘻碎石取石術(PCNL,一種新型的微創式取石手術)比傳統開腹手術的成功率更高:從78%提高到83%。

 

更仔細檢查,卻發現趨勢反過來了。按照結石大小把數據分成兩組之後,經皮腎造瘻碎石取石術在兩組的成功率都比傳統手術「更低」。這怎麼可能?

 

問題出在這項研究沒有使用隨機指派。它只是在檢閱醫療紀錄,結果發現醫生對每位病人的處置方式有系統性的偏差。腎結石較大、不易清除的病人接受的是傳統開刀手術,而結石較小、容易清除的病人則接受經皮腎造瘻碎石取石術。想必醫生比較放心在小結石的病人身上採用不熟悉的新方法,對於棘手的病例就回歸傳統開刀手術。

 

新手術不見得比較好,但被拿到最容易的患者身上測試。倘若手術方法是以隨機指派的方式來選擇,而不是由外科醫生決定,就不會有這樣的偏差。一般而言,隨機指派能消除交絡變數,防止辛普森悖論引致相反的結果。純觀測研究特別容易受這個悖論影響。

 

這個問題在醫學上很常見,就像下一個例子顯現的。細菌性腦膜炎是腦和脊髓的周圍組織受到了感染,已知會迅速擴散,如果不立即處置就會造成永久傷害,尤其在兒童身上。在英國,只要全科(家醫科)醫師認為病童可能罹患腦膜炎,通常會先開盤尼西林(又稱青黴素)給他們,然後送到醫院做進一步檢查及治療,目標是及早開始治療,不能等孩童送到醫院再說。

 

為了看看早做處置是不是真的有用,有一項觀測研究審視了四百四十八個被診斷為腦膜炎並送往醫院的孩童的紀錄。經過簡單分析,顯示有家庭醫師開盤尼西林的孩童在治療期間死亡的機率較小。

 

再仔細檢視這些數據之後,卻會呈現相反的結論。有許多孩童是直接送到醫院,根本沒看家庭醫生,這表示他們最初並沒有注射盤尼西林;這些孩童也是病情最嚴重的——由父母直接急忙送到醫院。假如把他們從數據中剔除,你只問:「在先去看了家庭醫師的孩童當中,那些給過盤尼西林的孩子的治療結果比較好嗎?」那麼答案毫無疑問是:「沒有」比較好。給過盤尼西林的孩子死亡的機率高出許多。

 

然而這是觀測研究,所以我們無法確定是盤尼西林「造成」他們死亡。我們可以推測,細菌被消滅的過程中釋出的毒素有可能會導致休克,不過這還沒有得到實驗證實。又或者,家庭醫師也許只給情況最嚴重的孩童施打盤尼西林。沒有做隨機化試驗,就不能斷定。

 

遺憾的是,要進行隨機化對照實驗很難,有時候甚至做不到。舉例來說,刻意不給有腦膜炎的孩童注射盤尼西林,可能會被視為缺德的行為。至於非醫療方面的例子,如果你要比較聯合航空和美國大陸航空的班機延誤紀錄,你會發現平均起來聯航的延誤航班較多,但就進行比較的各機場來看,大陸航空誤點的機率較大。結果發現,聯航在天氣不佳城市的航班比較多,延誤最多的那些機場拖垮了平均值。

 

可是你不能把航班隨機指派到聯航或大陸航空。你不見得可以消除每一個交絡因子,只能度量這些因子,然後期望全部都度量到了,沒有遺漏。

 

 

 

【重點提示】

 

l   切記,不具統計顯著性的變數不一定沒有效應;可能是你的檢定力不足以檢測出它的效應。

 

l   盡可能避免逐步迴歸。這種程序有時候很有用,但最後建立出的模型是有偏差的,而且難以解釋。其他的選擇方法,例如最小絕對緊縮與選擇算子,可能更為適合。或是可能根本沒必要選擇變數。

 

l   若要測試你的模型跟數據配適得如何,可用單獨的數據集或程序,譬如交叉確認。

 

l   留意那些可能產生誤導或相反結果(像是辛普森悖論)的交絡變數,可能的話,用隨機指派去消除這些變數。

 

 



《不敗的數據學》從統計數字中看見真相的12堂思考訓練,不被造假及濫用的數字唬弄!

不敗的數據學-立體書封300    
      


出版時間︰
2018.03.15
作者︰
艾力克斯‧萊因哈特 (Alex Reinhart)
定 價︰380元

★★從謊言到武器,用統計的語言來思考,在複雜的資料中找出秩序與意義★★

 

1個數據,2種解答!如何聰明選擇數據?如何把數據藏起來?

如何將數據屈打成招?怎麼知道某個成果是靠操弄數據得來的?

如果知道有多少人的統計分析其實做錯了,你還會相信所謂專家學者的研究嗎?

 

★令人瞠目結舌的統計手法實證案例,從科學發現、經濟生活到日常的數據學

★做對分析、避免陷阱,讓你讀懂每一個數字,思考判斷不出錯

★數據分析網站、著名統計學家強力推薦,從此改變你對統計的看法,決斷無懈可擊

 

――――從本書中可以學到――――

●透視研究者竄改數據的手法,揭露捏造成果取信大眾的伎倆

●如何看穿不可信的資訊,找出遺漏的細節,避免偏誤

●問對問題,做對實驗設計,選對統計分析方法,然後堅持到底

●如何思考p值、顯著性、非顯著性、信賴區間和迴歸

●正確選擇樣本大小,避免偽陽性

●報告你所做的分析,發表你的數據和原始碼

●可依循的程序,可採取的防範措施,可用的分析軟體

 

▌統計會犯錯!我們需要蒐集多少數據才能看清現實的真貌?

優秀的研究帶來科學進展,而有好的統計分析才有優秀的研究。但統計分析要做得正確並不容易,就連最優秀、最聰明的人也不例外。如果你知道有多少科學家的分析其實做錯了,可能會嚇一跳。

資料分析是科學的基礎,也是數據時代鋪天蓋地襲來的浪潮。統計學提供了威力強大的工具,能夠在最複雜的資料裡找出秩序與意義。但在這些以科學之名進行的研究分析和理論中,究竟潛藏了多少極不應該出錯的謬誤?

數據解讀錯誤對現實世界的重大影響超乎想像。醫學臨床試驗主導了我們的醫療照護,確定強效新處方藥的安全性,犯罪學專家評估降低犯罪的不同方法,流行病學家設法減緩新疾病的傳播,市場行銷人員和業務經理努力找出最好的產品銷售方式——這一切歸結到底都是統計。但卻經常是做錯的統計。

 

▌透視謬誤的原形,「統計」讓你不失敗!

「謊言、他媽的謊言、統計數字」,很多已發表的研究結果屬於這三種謊言當中的一種。製藥產業似乎特別想要忽視那些證明自己的藥品沒有療效的已發表研究,來讓證據產生偏誤。遺漏的數據和刊登偏誤歪曲了我們對重要議題的見解。就連做得正確的統計分析也不可信任。藉由大量的技巧和分析方法,「將數據屈打成招」非常容易。如果沒有通靈能力,我們幾乎不可能知道某個「成果」是不是靠操弄數據得來的。

本書列舉大量案例,揭露資料分析中的謬誤有多麼常見,並以清晰明瞭的推理來說明這些錯誤是怎麼產生的,又應該如何避免。書中將檢視令人尷尬的統計錯誤和疏漏,深入了解導致這些疏失產生的誤解和科學政治,最後開始改進做統計分析的方法和看穿數據真相的方式。

任何需要做數據分析、不想被數字唬弄,以及所有想了解如何讓統計這項分析工具發揮最大效益的人,都應該讀讀本書!

   

【對本書的讚譽】

「珍貴的小書……很精采,門外漢也能讀懂。」

──阿爾伯托.開羅(Alberto Cairo),邁阿密大學計算科學中心視覺化計畫主任

「如果你分析帶有規則性的數據,但不確定分析得對不對,請來讀這本書。」

──邱南森(Nathan Yau),數據流網站(FlowingData)

「有趣又豐富的指南……清晰明瞭的彙整。」

──約翰.沃斯(John A. Wass),《科學計算》期刊(Scientific Computing)

「我絕對會向對醫學統計有興趣的人,以及不喜歡統計的醫學系學生或醫生推薦這本書!」

──卡緹.邦斯博士(Dr. Catey Bunce),摩菲眼科醫院國民醫療服務基金信託(Moorfields Eye Hospital NHS Foundation Trust)首席統計學家

「我非常喜歡這本書,也打算跟許多學生分享……精采極了。」

──妮可.拉齊威爾博士(Dr. Nicole Radziwill),詹姆斯麥迪遜大學(James Madison University)整合科技系助理教授

「我希望每位醫生都能讀一讀這本書。」

──艾瑞克.拉莫特博士(Dr. Eric LaMotte),華盛頓大學內科住院醫師訓練計畫

「很大膽的一本書,也很引人入勝……十分有趣,而且會從此改變你對統計的觀感。」

──班.洛斯克(Ben Rothke),資訊安全專業人員

「寫得很好又有趣的實用指南,書裡談的都是今天統計專業工作中最常遇到的問題。」

──Civil Statistician部落格

「凡是希望有機會了解研究結果的人,都應該把這本書當成寶貴的指南,這本書可幫助你正確理解。」

──珊卓拉.亨利―史托克(Sandra Henry-Stocker),ITworld網站

「任何一位數據科學家都該添購的重要藏書。除此之外,簡練的文字風格會抓住你的興趣,也會為你日後的計畫激發創意。強力推薦。」

──insideBIGDATA網站

  目錄  



致謝

前言

【第1章  漫談統計顯著性】
▏p值的威力
有通靈能力的統計
奈曼╱皮爾森檢定
▏對區間要信賴

【第2章  統計檢定力與檢定力不足的統計】
▏檢定力曲線
▏檢定力不足的嚴重威脅
  ━為什麼檢定力不足?
  ━錯誤的紅燈右轉政策
▏信賴區間與增強能力
▏真實性膨脹
  ━很小的極端

【第3章  偽重複:聰明選擇數據】
▏偽重複實例
▏解釋偽重複
▏批次式生物學
▏同步偽重複

【第4章  P值與基本率謬誤】
▏基本率謬誤
  ━小測驗
  ━醫學檢驗中的基本率謬誤
  ━如何用抽菸統計數字騙人?
  ━拿起武器對抗基本率謬誤
▏要是一開始沒成功,就一試再試
▏腦造影中的混淆視聽資訊
▏控制偽發現率

【第5章  誤判顯著性】
▏顯著性中的不顯著差異
▏盯著顯著性看

【第6章  雙重數據】
▏循環論證式分析
▏向平均數迴歸
▏終止規則

【第7章  連續性的錯誤處理】
▏不必要的二分法
▏統計檢定力不足
▏討厭的混淆變量

【第8章  濫用模型】
▏從數據擬合出西瓜
▏相關性與因果關係
▏辛普森悖論

【第9章  研究自由:美好的悸動?】
一點點自由是件危險的事
▏避免偏誤

【第10章  人人都會犯錯】
▏無法重現的遺傳學
▏輕鬆做到重現性
▏實驗、沖洗乾淨、重做一次

【第11章  把數據藏起來】
▏被扣押的數據
  ━分享障礙
  ━數據衰減
▏就只是漏掉細節
  ━我們知道自己不知道的那些數據
  ━結果報告偏誤
▏檔案櫃裡的科學
  ━未發表的臨床試驗
  ━看出報告偏誤
  ━強制公開

【第12章  我們能夠做的事】
▏統計教育
▏統計出版
▏你的職責

參考資料


  作者簡介  

艾力克斯‧萊因哈特Alex Reinhart
美國卡內基美隆大學(Carnegie Mellon University)統計學講師和博士班學生。德州大學奧斯汀分校物理學士,研究如何利用統計學和物理學偵測放射性裝置的位置。


  譯者簡介  

畢馨云
清華大學數學系畢業,曾任科普書編輯十多年,目前為業餘交響樂團團員。譯有《這才是數學》、《科學酷媽的育兒大探險》、《氣候危機大預警》、《學數學,弄懂這39個數字就對了》、《工程之書》、《原來數學這麼漂亮》,另有譯作刊於《BBC知識》雜誌。

 

 

arrow
arrow
    全站熱搜

    facesfaces 發表在 痞客邦 留言(0) 人氣()