范德比爾特大學(xué)醫(yī)學(xué)中心的一個研究小組對手術(shù)患者與其醫(yī)療團隊之間的電子消息線程感興趣,測試了某些常用的機器學(xué)習(xí)算法如何根據(jù)臨床決策的復(fù)雜性對此類交換進行分類。他們的報告先于《外科研究雜志》印刷版發(fā)布在網(wǎng)上。
作者指出,醫(yī)療保險等醫(yī)療保健支付者在確定服務(wù)費用時考慮了醫(yī)療決策的復(fù)雜性。
作者寫道:“如果有效,自動消息分析可能會量化在線提供的護理或支持在線護理的計費。”它可以幫助做出人員配置決策,并且“可能有助于[消息]分類”。
兩名外科醫(yī)生兼研究人員根據(jù)醫(yī)療決策的復(fù)雜性獨立標記了 500 個線索,并討論任何分歧,就每個線索的標簽達成共識:簡單、低、中等和無決定。(事實證明,該集合中沒有高度復(fù)雜的線程。)
該團隊測試了兩種標準多類機器學(xué)習(xí)算法與此專家分類的匹配程度,一種是隨機森林分類器,另一種是多項式樸素貝葉斯分類器。每個線程都在 450 個標記線程上進行訓(xùn)練和驗證,然后在其余 50 個線程上進行測試。準確度以精確度(即檢索到的真陽性與檢索到的真陽性和假陽性之和的比率)和召回率(即比率)來衡量檢索到的真陽性數(shù)與集合中的所有陽性數(shù)的比值。
在他們的集合的四個標簽中,即簡單、低、中等或無臨床決策復(fù)雜性,分數(shù)為 1.0 表示完美,該團隊的兩個機器學(xué)習(xí)模型的最佳性能是精確度為 0.58,召回率為 0.63。
“雖然它們的表現(xiàn)遠遠優(yōu)于第三個程序,該程序通過簡單地添加每個消息線程中的醫(yī)學(xué)術(shù)語數(shù)量來對復(fù)雜性進行分級,但如果沒有更多數(shù)據(jù)和進一步分析,當前訓(xùn)練的兩種機器學(xué)習(xí)算法都不能被認為足以用于臨床使用,”該研究的主要作者、生物醫(yī)學(xué)信息學(xué)系研究員 Lina Sulieman 博士說。“這項研究的細節(jié)中有幾項發(fā)現(xiàn)可以幫助我們改進這種類型的自動化分析。”
Sulieman 和其他人之前的研究使用機器學(xué)習(xí)根據(jù)患者消息中表達的一般需求類型(醫(yī)療、后勤、信息等)對傳入的患者消息進行分類。根據(jù)作者的說法,這似乎是自動對消息進行排序的首次嘗試根據(jù)臨床決策復(fù)雜性進行線程。
根據(jù)這項研究,VUMC 的患者門戶網(wǎng)站 My Health at Vanderbilt(研究中使用的線程的來源)在典型的一個月內(nèi)收到來自患者和家人的大約 30,000 條消息。
標簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!