雖然目前有十幾個獲批用于乳腺癌篩查的人工智能系統(tǒng),但很難客觀地評估它們的臨床表現(xiàn)。然而,現(xiàn)在有一個瑞典驗證平臺可以比較人工智能系統(tǒng)檢測乳腺癌跡象的能力——它的開發(fā)是由卡羅林斯卡學(xué)院的研究人員領(lǐng)導(dǎo)的。
該試點項目于 2021 年啟動,該平臺已于去年準(zhǔn)備好進行試用。到目前為止,它已被用于根據(jù)來自瑞典三個地區(qū)的約 40,000 張乳房 X 線照片開始評估三個不同公司的算法。
“評估可能在臨床上使用的 AI 算法的診斷準(zhǔn)確性非常重要,”項目負(fù)責(zé)人、卡羅林斯卡學(xué)院腫瘤病理學(xué)系研究員、卡羅林斯卡大學(xué)醫(yī)院放射科醫(yī)生 Fredrik Strand 說。“即使它們符合監(jiān)管要求,也不意味著它們在所有情況下都有效。”
在發(fā)表在《醫(yī)學(xué)影像學(xué)雜志》上的一篇論文中,研究人員描述了他們是如何設(shè)計該平臺的,希望更多的團隊能夠開發(fā)出類似的平臺。
實現(xiàn)人工智能系統(tǒng)的客觀評估
Fredrik Strand說:“通過讓我們的代碼可以免費訪問,我們希望它能用于實施類似的平臺,用于對除乳腺癌以外的其他類型的癌癥進行算法評估,”他補充說,人們熱切期待這種客觀評估。該國的幾個地區(qū)已經(jīng)在考慮開始使用 AI 進行乳房 X 光檢查。
“迫切需要一個可以在當(dāng)?shù)叵嚓P(guān)條件下評估算法的系統(tǒng),”他說。“重要的是,每家醫(yī)院都選擇適合其要求和特定情況的正確系統(tǒng),以避免遺漏乳腺癌或召回過多的健康女性。”
目前還沒有針對指定數(shù)據(jù)集的既定評估程序來評估 AI 算法在醫(yī)學(xué)診斷中的準(zhǔn)確性。人工智能系統(tǒng)的制造商已經(jīng)在不同的數(shù)據(jù)集上訓(xùn)練和測試了他們的算法,這些結(jié)果用于監(jiān)管批準(zhǔn)。在該平臺中,所有算法都處理相同的圖像,并將結(jié)果與??從國家乳腺癌質(zhì)量登記冊 (NKBC) 中提取的實際癌癥診斷數(shù)據(jù)進行比較,揭示算法之間的差異。由于今天的 AI 算法已經(jīng)針對開發(fā)人員可以訪問的特定人群進行了訓(xùn)練,因此它們可能包含應(yīng)該識別的偏差。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!