新的機器學習方法有望加速藥物設(shè)計

2021-12-26 14:32:50 來源：用戶：

這種被研究團隊稱為“轉(zhuǎn)化機器學習”(TML)的新方法在解決科學問題(包括藥物設(shè)計)的三個領(lǐng)域比傳統(tǒng)機器學習做出了更好的預測。

“在藥物設(shè)計中，我們發(fā)現(xiàn) TML 提供了對藥物靶標特異性、藥物之間的關(guān)系以及靶蛋白之間關(guān)系的洞察，”作者寫道，由約翰摩爾斯大學計算機科學與數(shù)學學院的 Ivan Olier 領(lǐng)導。英國

傳統(tǒng)機器學習與 TML

傳統(tǒng)的監(jiān)督 ML 算法在標記示例(例如，不同動物的標記照片)上進行訓練，從中學習識別內(nèi)在特征(例如，“毛茸茸”和“小”)。相反，TML 依賴于來自在其他相關(guān)任務上訓練的 ML 模型的預測的外在特征。

例如，要訓練一個 TML 模型來識別所有已知的動物物種，并且預計會添加新的動物物種，首先要對已知物種(例如貓、兔子和驢)應用現(xiàn)有的預測模型。這些模型的輸出將生成新的外在特征，例如“貓性”、“兔子性”和“驢性”，然后將用于訓練元級 ML 模型以使用此級別的表示進行預測。該方法使 TML 模型能夠捕獲最初未編碼的動物的屬性，例如可愛(貓和兔子共有)和頭部側(cè)面有眼睛(兔子和驢共有)。

“典型的 ML 系統(tǒng)在學習識別一種新型動物時必須從頭開始——比如小貓——TML 可以利用與現(xiàn)有動物的相似性：小貓像兔子一樣可愛，但沒有像兔子那樣長的耳朵兔子和驢，”領(lǐng)導這項研究的劍橋化學工程和生物技術(shù)系教授羅斯金在一份聲明中說。“這使得 TML 成為一種更強大的機器學習方法。”

藥物發(fā)現(xiàn)的承諾

研究人員表示，TML 在藥物發(fā)現(xiàn)領(lǐng)域顯示出特別的前景。典型的 ML 方法將根據(jù)分子形狀和結(jié)構(gòu)等內(nèi)在特征來搜索藥物分子，而 TML 通過檢查其他 ML 模型傳達的有關(guān)特定分子的信息來加快該過程。

該論文包括一個使用 TML 預測定量結(jié)構(gòu)活性關(guān)系 (QSAR) 的案例研究，這是早期藥物發(fā)現(xiàn)的一個常見步驟。給定一個目標(通常是一個蛋白質(zhì))和一組具有相關(guān)活動(例如，抑制目標蛋白質(zhì))的化合物(小分子)，QSAR 任務是學習從分子表示到活動的預測映射。在 TML 方法中，基于內(nèi)在描述符的標準 ML 方法首先應用于現(xiàn)有的 QSAR 預測任務，然后將其輸出用作可應用于新 QSAR 任務的新 TML 模型的外在特征。

為了評估 QSAR 學習中的 TML 方法，研究人員使用 1,024 位分子指紋表示作為內(nèi)在特征，針對 2,219 個 QSAR 問題訓練了各種 ML 方法。然后，他們使用之前學習的 ML 模型預測的復合活動作為 TML QSAR 模型的外在屬性。

　　免責聲明：本文由用戶上傳，與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風險自擔。如有侵權(quán)請聯(lián)系刪除！

相關(guān)閱讀