這種被研究團(tuán)隊稱為“轉(zhuǎn)化機(jī)器學(xué)習(xí)”(TML)的新方法在解決科學(xué)問題(包括藥物設(shè)計)的三個領(lǐng)域比傳統(tǒng)機(jī)器學(xué)習(xí)做出了更好的預(yù)測。
“在藥物設(shè)計中,我們發(fā)現(xiàn) TML 提供了對藥物靶標(biāo)特異性、藥物之間的關(guān)系以及靶蛋白之間關(guān)系的洞察,”作者寫道,由約翰摩爾斯大學(xué)計算機(jī)科學(xué)與數(shù)學(xué)學(xué)院的 Ivan Olier 領(lǐng)導(dǎo)。英國
傳統(tǒng)機(jī)器學(xué)習(xí)與 TML
傳統(tǒng)的監(jiān)督 ML 算法在標(biāo)記示例(例如,不同動物的標(biāo)記照片)上進(jìn)行訓(xùn)練,從中學(xué)習(xí)識別內(nèi)在特征(例如,“毛茸茸”和“小”)。相反,TML 依賴于來自在其他相關(guān)任務(wù)上訓(xùn)練的 ML 模型的預(yù)測的外在特征。
例如,要訓(xùn)練一個 TML 模型來識別所有已知的動物物種,并且預(yù)計會添加新的動物物種,首先要對已知物種(例如貓、兔子和驢)應(yīng)用現(xiàn)有的預(yù)測模型。這些模型的輸出將生成新的外在特征,例如“貓性”、“兔子性”和“驢性”,然后將用于訓(xùn)練元級 ML 模型以使用此級別的表示進(jìn)行預(yù)測。該方法使 TML 模型能夠捕獲最初未編碼的動物的屬性,例如可愛(貓和兔子共有)和頭部側(cè)面有眼睛(兔子和驢共有)。
“典型的 ML 系統(tǒng)在學(xué)習(xí)識別一種新型動物時必須從頭開始——比如小貓——TML 可以利用與現(xiàn)有動物的相似性:小貓像兔子一樣可愛,但沒有像兔子那樣長的耳朵兔子和驢,”領(lǐng)導(dǎo)這項研究的劍橋化學(xué)工程和生物技術(shù)系教授羅斯金在一份聲明中說。“這使得 TML 成為一種更強(qiáng)大的機(jī)器學(xué)習(xí)方法。”
藥物發(fā)現(xiàn)的承諾
研究人員表示,TML 在藥物發(fā)現(xiàn)領(lǐng)域顯示出特別的前景。典型的 ML 方法將根據(jù)分子形狀和結(jié)構(gòu)等內(nèi)在特征來搜索藥物分子,而 TML 通過檢查其他 ML 模型傳達(dá)的有關(guān)特定分子的信息來加快該過程。
該論文包括一個使用 TML 預(yù)測定量結(jié)構(gòu)活性關(guān)系 (QSAR) 的案例研究,這是早期藥物發(fā)現(xiàn)的一個常見步驟。給定一個目標(biāo)(通常是一個蛋白質(zhì))和一組具有相關(guān)活動(例如,抑制目標(biāo)蛋白質(zhì))的化合物(小分子),QSAR 任務(wù)是學(xué)習(xí)從分子表示到活動的預(yù)測映射。在 TML 方法中,基于內(nèi)在描述符的標(biāo)準(zhǔn) ML 方法首先應(yīng)用于現(xiàn)有的 QSAR 預(yù)測任務(wù),然后將其輸出用作可應(yīng)用于新 QSAR 任務(wù)的新 TML 模型的外在特征。
為了評估 QSAR 學(xué)習(xí)中的 TML 方法,研究人員使用 1,024 位分子指紋表示作為內(nèi)在特征,針對 2,219 個 QSAR 問題訓(xùn)練了各種 ML 方法。然后,他們使用之前學(xué)習(xí)的 ML 模型預(yù)測的復(fù)合活動作為 TML QSAR 模型的外在屬性。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!