💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
sensitivity統計 在 新思惟國際 Facebook 的精選貼文
💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
sensitivity統計 在 Facebook 的最佳貼文
你需要自己買快篩試劑嗎?
今天我不談法規的問題
我今天想來談談從科學的角度出發你到底需不需要
董老師這篇文章寫的很棒
淺顯易懂
有學過生物統計學的來複習一下吧
沒有學過的大家也可以來看看熱鬧
特別徵詢過老師的同意
將原文轉載至此
但為了希望讓更多的人看到所以我不直接用分享的而做轉載
請多包涵
原文在此👇👇👇
https://www.facebook.com/100002089426441/posts/4082960111783596/?d=n
先說我自己想告訴你的話吧👇👇👇
我現在不建議一般人自行買來篩檢
尤其你自己是沒有症狀無接觸史或在低風險的區域
有可能你是為了買安心結果出來嚇死你自己反而必須去篩檢站做確認人擠人反而增加感染的風險
而且
你自己採檢我怎麼知道你採檢的方式對不對?
如果你真的有感染結果沒有正確採檢到你會不會很想吐?
如果你採檢結果是沒有的因此讓你喪失戒心很高興的到處趴趴走這不會比較好畢竟你這時候沒有中但是下1秒沒做好防護隨時還是都可能被感染
防疫的作為隨時都會因為狀況不同而隨時改變
但在現階段你自己買來採檢只是為了求心安我覺得真的不適合啦
當然接下來如果狀況有變化我會再隨時跟大家聊聊
簡單口語化再說明一下👇👇👇
如果
你是在高盛行率的地方
這確實是一個很好用的工具
如果你是在低盛行率的地方
10個快篩驗出來陽性結果只有大概三個是真的感染
看到這種結果你可能會想罵髒話
但這就是科學
如果你手上沒有其他確診工具
無誠勿試
但話又說回來
也沒有哪一種確診工具是百分之百準確的
即便目前的黃金標準(golden standard)RT-PCR也是如此
這個輪迴繼續存在
所以真的拜託大家不要聽到普篩就高潮
這絕對不該是政治問題
這是科學問題
誰再來跟我鬼吵這個或是帶風向說也說不聽的我一定不會跟你客氣
再說一次
沒有什麼東西是絕對的好與壞
都要看你怎麼用在什麼時候用
之前就說過了
電擊棒很屌吧
但你會想要隨便用電擊棒打小孩嗎
(先說我不打小孩的😌)
在適當的時間用適當的工具與方法
這是一種藝術
也是科學問題
人家麻豆穿Dolce & Gabbana西裝超帥我穿起來就是俗仔
就醬
原文在此👇❤️👇
=====================
COVID-19快篩試劑為何不適用於低風險率地區?
我想很多人最近都會被"偽陽性"這個名詞搞得昏頭轉向,尤其是羅一鈞副署長說的"低風險地區偽陽性可能高達7成"。好吧! 我現在剛好煮好晚餐把我家那口子的嘴巴塞飽了,有點空閒,就來告訴大家這7成偽陽性是如何計算出來的。內容有點長,沒興趣的人請直接閃,我主要是要幫我的學生們(醫技系或醫學系)複習一下7月即將面臨的國考啦! 順便貼在FB哩。
只要是檢驗試劑我們一定都會討論到敏感度(sensitivity)和特異性(specificity)。至於臨床端比較重視的是陽性預測值(Positive Predictive Value,PPV)和陰性預測值(Negative Predictive Value,NPV)。這些名詞的定義及計算我整理在下面的第一張圖。所以大家要先清楚定義之後(尤其是陽性預測值PPV),我們再來估算"在低風險區做COVID-19快篩可能的偽陽性機率"。至於目前台灣的COVID-19快篩試劑有TFDA核准上市的廠商有3-4家。以寶齡富錦Vstrip最有名。當然試劑核准一定會經過實驗測試程序,包括多少個陽性檢體及陰性檢體,以估算出試劑的敏感度和特異性。但因為台灣一直沒有疫情發生,因此這些去年早已核准上市的快篩試劑事實上在台灣並無法用於真正的臨床檢體檢驗的評估。直到最近的台灣本土疫情爆發,PCR來不及檢驗,所以COVID-19快篩試劑就緊急派上用場了。至於這些不同廠牌的快篩試劑的準確度(包括特異性敏感度...),我相信CDC不久就會有評估報告了,今天就先別討論。
好吧!進入重點囉! 假如標示著特異性是98%的快篩試劑,意味著"沒有感染且檢驗陰性的機率是98%",也就是說這試劑的偽陽性是2%。但為何還會有羅副署長說的"在低危險區,COVID-19快篩有7成(70%)的偽陽性"呢。2%怎會變成70%呢? 應該很多人會一頭霧水,讓我算給你們看...
如第二張圖,羅副署長說的,假如COVID-19快篩試劑準確性(敏感度和特異性)是98%。(1)在高風險地區(例如萬華)假設盛行率是10%及(2)在低風險地區(例如宜蘭)假設盛行率是1%。現在(1)和(2)分別都有1000個人去做快篩,依照試劑98%的敏感度及98%特異性來計算。我們來算一下分別可能結果:
(1) 在高風險地區(例如萬華)假設盛行率是10%,表示這1000人中100人有感染900人沒感染
有感染(100人) 沒感染(900人)
檢驗陽性 a (98) c (18) a+c (116)
檢驗陰性 b (2) d (882) b+d
a=100x98%=98 b=100-98=2
d=900x98%=882 c=900-882=18
陽性預測值(PPV)=a/a+c=98/98+18=84.5%
=> 偽陽性=1-PPV=15.5%
=> 也就是說高危險區快篩是陽性的約有15%是偽陽性
(2)若在低風險地區(例如宜蘭)假設盛行率是1%,表示這1000個人中有10人有感染990人沒有感染
有感染(10人) 沒感染(990人)
檢驗陽性 a (9.8) c (19.8) a+c (29.6)
檢驗陰性 b (0.2) d (970.2) b+d
a=10x98%=9.8 b=10-9.8=0.2
d=990x98%=970.2 c=990-970.2=19.8
陽性預測值(PPV)=a/a+c=9.8/9.8+19.8=33.1%
=> 偽陽性=1-PPV=66.9%
=> 也就是說低危險區快篩是陽性的約有67%(近7成)是偽陽性
當然一個疫情在各地區的盛行率一定是要在整個疫情結束之後才可以較準確地統計出來。但由以上的計算希望可以幫大家解惑"為何COVID-19快篩試劑不適用於低風險率地區?"
=====================
好的
各位新同學
我們有目錄
要發問前可以先找一下喔👇👇👇👇
導覽目錄在這裡
https://drsu.blog/2017/12/18/super-list/
不然
置頂文也有👇👇👇👇
https://www.facebook.com/100047331422378/posts/192828068971573/?extid=0&d=n
對了
有同學說我寫太多很難找
關於這點我很抱歉
可以善用搜尋功能喔👇👇👇👇
https://drsu.blog/2018/01/01/super180101/
關於基因醫學部落格在這裡👇👇👇
https://sofivagenomicsblog.wordpress.com