ARES深度學(xué)習(xí)系統(tǒng)改進(jìn)3DRNA結(jié)構(gòu)預(yù)測
2021年8 月 26 日——一種名為 Atomic Rotationally Equivariant Scorer (ARES) 的新深度學(xué)習(xí)系統(tǒng)顯著改善了對 RNA 結(jié)構(gòu)的預(yù)測,而不是以前的人工智能 (AI) 模型。斯坦福大學(xué)研究人員在8 月 26 日發(fā)表在《科學(xué)》雜志上的一篇論文中描述了這一進(jìn)展,它可能有助于科學(xué)家們發(fā)現(xiàn) RNA 的生物學(xué)功能,并為發(fā)現(xiàn)新型 RNA 靶向藥物鋪平道路。
像蛋白質(zhì)一樣,RNA 分子扭曲并折疊成復(fù)雜的 3D 形狀,使它們能夠執(zhí)行廣泛的細(xì)胞功能,包括催化反應(yīng)、調(diào)節(jié)基因表達(dá)、調(diào)節(jié)先天免疫和感知小分子。
然而,盡管科學(xué)家對蛋白質(zhì)結(jié)構(gòu)的理解在過去十年中取得了長足的進(jìn)步,但他們對 RNA 結(jié)構(gòu)的了解卻遠(yuǎn)遠(yuǎn)落后,盡管人類基因組中轉(zhuǎn)錄成 RNA 的部分大約是轉(zhuǎn)錄成 RNA 的部分的 30 倍。蛋白質(zhì)的代碼。
理解蛋白質(zhì)折疊的進(jìn)展反映在預(yù)測模型的成功上,例如由谷歌 AI 分支 DeepMind 開發(fā)的AlphaFold。該模型通過利用數(shù)千種已知蛋白質(zhì)結(jié)構(gòu)中的序列-結(jié)構(gòu)關(guān)系,學(xué)會了如何根據(jù)氨基酸序列準(zhǔn)確預(yù)測蛋白質(zhì)結(jié)構(gòu)。
然而,在 RNA 的情況下,可用的訓(xùn)練數(shù)據(jù)要少得多。這部分是因?yàn)?RNA 結(jié)構(gòu)目前還沒有被很好地理解,并且因?yàn)?RNA 序列信息提供的關(guān)于 3D RNA 結(jié)構(gòu)的信息比蛋白質(zhì)的情況少。
為了解決這個問題,由斯坦福大學(xué)博士研究生、Atomic AI 創(chuàng)始人兼首席執(zhí)行官 Raphael Townshend 領(lǐng)導(dǎo)的研究人員設(shè)計(jì)了 ARES,以根據(jù)最小假設(shè)進(jìn)行 RNA 結(jié)構(gòu)預(yù)測。ARES 深度神經(jīng)網(wǎng)絡(luò)接受每個原子的 3D 坐標(biāo)和化學(xué)元素類型的結(jié)構(gòu)模型作為輸入,然后預(yù)測模型與未知真實(shí) 3D RNA 結(jié)構(gòu)的均方根偏差。
ARES 不包含關(guān)于結(jié)構(gòu)模型的哪些特征與評估其準(zhǔn)確性相關(guān)的任何假設(shè)。即使是雙螺旋、堿基對、核苷酸和氫鍵等基本結(jié)構(gòu)概念也沒有預(yù)先編程到系統(tǒng)中。
與在數(shù)千種已知蛋白質(zhì)結(jié)構(gòu)上訓(xùn)練的 AlphaFold 不同,ARES 訓(xùn)練數(shù)據(jù)僅限于 18 個 RNA 分子,這些分子在 1994 年至 2006 年間發(fā)表了實(shí)驗(yàn)確定的結(jié)構(gòu)。
為了評估 ARES 識別以前未見過的 RNA 的準(zhǔn)確結(jié)構(gòu)模型的能力,斯坦福大學(xué)的研究人員編制了一個基準(zhǔn)數(shù)據(jù)集,其中包含七年來在 RNA-Puzzles 競賽中獲勝的參賽作品,這是由 RNA 科學(xué)界組織的一項(xiàng)長期挑戰(zhàn). 根據(jù) RNA-Puzzles 的規(guī)則,當(dāng)社區(qū)科學(xué)家通過實(shí)驗(yàn)發(fā)現(xiàn)新的 RNA 結(jié)構(gòu)時,他們不會公布細(xì)節(jié),直到其他 RNA-Puzzles 參與者提交了他們的結(jié)構(gòu)預(yù)測,然后根據(jù)他們與該結(jié)構(gòu)的匹配程度進(jìn)行判斷。實(shí)驗(yàn)確定的結(jié)構(gòu)。
對于 RNA-Puzzles 數(shù)據(jù)集中的每個 RNA 結(jié)構(gòu),研究人員使用 Rosetta FARFAR2 采樣軟件生成了至少 1,500 個結(jié)構(gòu)模型。然后,他們應(yīng)用經(jīng)過訓(xùn)練的 ARES 神經(jīng)網(wǎng)絡(luò)為每個模型生成一個分?jǐn)?shù)。還使用了其他三種評分方法進(jìn)行比較。
使用 ARES,10 個得分最高的結(jié)構(gòu)模型包括 81% 的基準(zhǔn) RNA 的實(shí)驗(yàn)正確模型。相比之下,其他三種評分方法在不到 50% 的時間內(nèi)包含正確的結(jié)構(gòu)。
接下來,研究人員將 ARES 的預(yù)測輸入到四輪新的 RNA-Puzzles 盲結(jié)構(gòu)預(yù)測挑戰(zhàn)賽中。四個實(shí)驗(yàn)確定但未發(fā)表的待預(yù)測 RNA 結(jié)構(gòu)包括腺病毒 VA-I RNA、嗜熱地芽孢桿菌T-box 鑒別器 tRNAGly、枯草芽孢桿菌T-box tRNAGly 和諾卡氏菌T-box tRNAIIe(蛋白質(zhì)數(shù)據(jù)庫 ID) 6OL3、6PMO、6POM 和 6UFM)。對于所有四種 RNA,ARES “贏得”了挑戰(zhàn),產(chǎn)生了任何方法中最準(zhǔn)確的結(jié)構(gòu)模型。
在未來的工作中,研究人員計(jì)劃為 ARES 提供除原子坐標(biāo)和每個原子的化學(xué)元素類型之外的更多信息,以查看這種額外的輸入是否會提高性能。
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!
- 海爾生物醫(yī)療亮相國門生物安全學(xué)術(shù)交流會 數(shù)智創(chuàng)新助生物安全發(fā)展
- 保定東大肛腸醫(yī)院丨誰是胃腸鏡檢查的“重點(diǎn)對象”?
- 產(chǎn)創(chuàng)融合 智匯柯橋 | 2025年優(yōu)秀博士后研究人員(紹興)研學(xué)活動順利舉行
- 天津松果生物醫(yī)療I型膠原蛋白原料獲NMPA備案 突破性技術(shù)引領(lǐng)膠原填充新標(biāo)準(zhǔn)
- EVIDENT SLIDEVIEW系列化身破局利劍,助力數(shù)智病理轉(zhuǎn)型
- 深度交流,成功舉辦!2025中國腸道大會亮點(diǎn)一覽
- 易嶺生物雙重發(fā)力,重構(gòu)口腔軟硬組織再生與美白護(hù)理新格局
- 安徽阜陽ID.4 X多少錢 2025款落地價全解買車必看
-
6月25-28日,由中國進(jìn)出境生物安全研究會、中國國際旅行衛(wèi)生保健協(xié)會主辦,中國青年創(chuàng)業(yè)就業(yè)基金會支持,中國出入...瀏覽全文>>
-
胃腸鏡檢查,聽起來可能有些令人不安,但實(shí)際上,它可能是生活中的救命稻草。對于一些人來說,定期進(jìn)行胃腸鏡...瀏覽全文>>
-
6月16日-20日,2025年優(yōu)秀博士后研究人員(紹興)研學(xué)活動順利舉行。本次活動匯聚了來自全國各地的百余名博士后,...瀏覽全文>>
-
近日,天津松果生物醫(yī)療科技有限公司自主研發(fā)的牛跟腱來源去端肽I型膠原蛋白原材料成功通過國家藥品監(jiān)督管理局...瀏覽全文>>
-
在數(shù)字化產(chǎn)業(yè)轉(zhuǎn)型的浪潮奔涌之際,病理學(xué)正經(jīng)歷著前所未有的革新機(jī)遇。奧偉登(Evident)憑借百年光學(xué)技術(shù)積淀,以...瀏覽全文>>
-
6月6-8日,CHINAGUT 2025中國腸道大會在寧波國際會議中心隆重舉辦。大會由南京醫(yī)科大學(xué)第二附屬醫(yī)院、國家消化...瀏覽全文>>
-
在第28屆北京國際口腔展這一行業(yè)風(fēng)向標(biāo)級盛會上,北京易嶺生物科技有限公司(下面簡稱易嶺生物)憑借重磅新品發(fā)...瀏覽全文>>
-
2025款上汽大眾ID 4 X在安徽阜陽地區(qū)的售價會根據(jù)配置和選裝包有所不同。基礎(chǔ)版車型的廠商指導(dǎo)價大約在20萬...瀏覽全文>>
-
嵐圖FREE,作為一款集豪華與智能于一體的新能源SUV,正以全新的姿態(tài)迎接每一位渴望高品質(zhì)出行的用戶?,F(xiàn)在,嵐...瀏覽全文>>
-
安徽阜陽的大眾ARTEON 2022新款現(xiàn)已到店,最低售價從34 80萬元起,無疑是近期購車的最佳時機(jī)。這款車型以其...瀏覽全文>>