紐約州伊薩卡市——康奈爾大學(xué)研究人員磨練和推進(jìn)的另一種統(tǒng)計(jì)方法可以使臨床試驗(yàn)更加可靠和可信,同時(shí)還有助于解決科學(xué)界所謂的“可復(fù)制性危機(jī)”。
在本月發(fā)表在《美國(guó)國(guó)家科學(xué)院院刊》上的一篇新論文中,康奈爾大學(xué)的研究人員進(jìn)一步研究了“脆弱性指數(shù)”,這是一種在醫(yī)學(xué)界獲得關(guān)注的方法,作為 p 值的補(bǔ)充,p 值是一種應(yīng)用于科學(xué)的概率測(cè)量,自1920 年代,有時(shí)甚至不顧后果地引用作為良好結(jié)果的證據(jù)。
“臨床醫(yī)生相信,他們執(zhí)行的程序和協(xié)議是通過(guò)合理的臨床試驗(yàn)得出的。少任何事情都會(huì)讓外科醫(yī)生感到緊張,這是理所當(dāng)然的,”查爾斯·A·亞歷山大 (Charles A. Alexander) 統(tǒng)計(jì)科學(xué)教授、論文合著者馬丁·威爾斯(Martin Wells)說(shuō)。“我們發(fā)現(xiàn),許多這些顯示出有希望的結(jié)果并發(fā)表在頂級(jí)期刊上的后續(xù)試驗(yàn)都是脆弱的。這是這項(xiàng)研究帶來(lái)的令人不安的驚喜。”
這篇由康奈爾大學(xué)的統(tǒng)計(jì)學(xué)家、威爾康奈爾醫(yī)學(xué)院和多倫多大學(xué)的醫(yī)生撰寫的論文提出了一種新的統(tǒng)計(jì)工具包,使用脆弱性指數(shù)作為替代方法,以幫助研究人員更好地確定他們的試驗(yàn)結(jié)果實(shí)際上是否可靠或者僅僅是偶然的產(chǎn)物。
“當(dāng)你告訴全世界應(yīng)該或不應(yīng)該使用某種治療方法時(shí),你希望該決定基于可靠的結(jié)果,而不是基于一兩個(gè)患者的結(jié)果可以以一種或另一種方式擺動(dòng)的結(jié)果,”本杰明說(shuō)貝爾博士'21,論文合著者,目前是羅徹斯特大學(xué)的博士后研究員。“這樣的結(jié)果可以被認(rèn)為是脆弱的。”
[Randomized,臨床試驗(yàn),以測(cè)試效果是外科手術(shù)和藥物治療是必不可少的。為了解釋試驗(yàn)結(jié)果的統(tǒng)計(jì)顯著性,幾十年來(lái),研究人員轉(zhuǎn)向了一種經(jīng)常被誤解的衡量標(biāo)準(zhǔn),即 p 值,以確定結(jié)果是否有價(jià)值或只是偶然發(fā)生。
但是,在過(guò)去的 15 年中,當(dāng)單獨(dú)使用且沒(méi)有支持方法時(shí),對(duì) p 值可靠性的懷疑越來(lái)越多,特別是因?yàn)檫^(guò)去的試驗(yàn)結(jié)果最初被認(rèn)為是強(qiáng)大的,無(wú)法在后續(xù)試驗(yàn)中復(fù)制。在2014 年使用脆性指數(shù)的一項(xiàng)研究中,研究人員分析了 400 項(xiàng)隨機(jī)臨床試驗(yàn),發(fā)現(xiàn)四分之一具有“統(tǒng)計(jì)顯著”p 值的試驗(yàn)實(shí)際上具有低得驚人的脆性評(píng)分,表明結(jié)果不太可靠。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!