這種被研究團隊稱為“轉化機器學習”(TML)的新方法在解決科學問題(包括藥物設計)的三個領域比傳統(tǒng)機器學習做出了更好的預測。
“在藥物設計中,我們發(fā)現(xiàn) TML 提供了對藥物靶標特異性、藥物之間的關系以及靶蛋白之間關系的洞察,”作者寫道,由約翰摩爾斯大學計算機科學與數(shù)學學院的 Ivan Olier 領導。英國
傳統(tǒng)機器學習與 TML
傳統(tǒng)的監(jiān)督 ML 算法在標記示例(例如,不同動物的標記照片)上進行訓練,從中學習識別內在特征(例如,“毛茸茸”和“小”)。相反,TML 依賴于來自在其他相關任務上訓練的 ML 模型的預測的外在特征。
例如,要訓練一個 TML 模型來識別所有已知的動物物種,并且預計會添加新的動物物種,首先要對已知物種(例如貓、兔子和驢)應用現(xiàn)有的預測模型。這些模型的輸出將生成新的外在特征,例如“貓性”、“兔子性”和“驢性”,然后將用于訓練元級 ML 模型以使用此級別的表示進行預測。該方法使 TML 模型能夠捕獲最初未編碼的動物的屬性,例如可愛(貓和兔子共有)和頭部側面有眼睛(兔子和驢共有)。
“典型的 ML 系統(tǒng)在學習識別一種新型動物時必須從頭開始——比如小貓——TML 可以利用與現(xiàn)有動物的相似性:小貓像兔子一樣可愛,但沒有像兔子那樣長的耳朵兔子和驢,”領導這項研究的劍橋化學工程和生物技術系教授羅斯金在一份聲明中說。“這使得 TML 成為一種更強大的機器學習方法。”
藥物發(fā)現(xiàn)的承諾
研究人員表示,TML 在藥物發(fā)現(xiàn)領域顯示出特別的前景。典型的 ML 方法將根據(jù)分子形狀和結構等內在特征來搜索藥物分子,而 TML 通過檢查其他 ML 模型傳達的有關特定分子的信息來加快該過程。
該論文包括一個使用 TML 預測定量結構活性關系 (QSAR) 的案例研究,這是早期藥物發(fā)現(xiàn)的一個常見步驟。給定一個目標(通常是一個蛋白質)和一組具有相關活動(例如,抑制目標蛋白質)的化合物(小分子),QSAR 任務是學習從分子表示到活動的預測映射。在 TML 方法中,基于內在描述符的標準 ML 方法首先應用于現(xiàn)有的 QSAR 預測任務,然后將其輸出用作可應用于新 QSAR 任務的新 TML 模型的外在特征。
為了評估 QSAR 學習中的 TML 方法,研究人員使用 1,024 位分子指紋表示作為內在特征,針對 2,219 個 QSAR 問題訓練了各種 ML 方法。然后,他們使用之前學習的 ML 模型預測的復合活動作為 TML QSAR 模型的外在屬性。
標簽:
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!