盡管每個(gè)人類細(xì)胞都包含大量基因,但這些所謂的“編碼”DNA序列僅占我們整個(gè)基因組的 1%。剩下的 99% 由“非編碼”DNA 組成——與編碼 DNA 不同,它不攜帶構(gòu)建蛋白質(zhì)的指令。
這種非編碼 DNA(也稱為“調(diào)節(jié)性”DNA)的一個(gè)重要功能是幫助打開(kāi)和關(guān)閉基因,控制蛋白質(zhì)的制造量(如果有的話)。隨著時(shí)間的推移,隨著細(xì)胞復(fù)制它們的 DNA 以生長(zhǎng)和分裂,這些非編碼區(qū)域經(jīng)常會(huì)出現(xiàn)突變——有時(shí)會(huì)調(diào)整它們的功能并改變它們控制基因表達(dá)的方式。許多這些突變是微不足道的,有些甚至是有益的。但有時(shí),它們可能與常見(jiàn)疾病(如 2 型糖尿病)或更危及生命的疾病(包括癌癥)的風(fēng)險(xiǎn)增加有關(guān)。
為了更好地了解這些突變的影響,研究人員一直在努力研究數(shù)學(xué)圖譜,使他們能夠查看生物體的基因組,預(yù)測(cè)哪些基因?qū)⒈槐磉_(dá),并確定該表達(dá)將如何影響生物體的可觀察特征。這些被稱為適應(yīng)度景觀的地圖大約在一個(gè)世紀(jì)前被概念化,以了解基因構(gòu)成如何影響一種常見(jiàn)的有機(jī)體適應(yīng)度,特別是:繁殖成功率。早期的適應(yīng)環(huán)境非常簡(jiǎn)單,通常只關(guān)注有限數(shù)量的突變?,F(xiàn)在可以獲得更豐富的數(shù)據(jù)集,但研究人員仍然需要額外的工具來(lái)表征和可視化這些復(fù)雜的數(shù)據(jù)。這種能力不僅有助于更好地理解個(gè)體基因如何隨著時(shí)間的推移而進(jìn)化,
在3 月 9 日發(fā)表在《自然》雜志上的一項(xiàng)新研究中,一組科學(xué)家開(kāi)發(fā)了一個(gè)框架,用于研究調(diào)控 DNA 的適應(yīng)性景觀。他們創(chuàng)建了一個(gè)神經(jīng)網(wǎng)絡(luò)模型,當(dāng)對(duì)數(shù)億次實(shí)驗(yàn)測(cè)量進(jìn)行訓(xùn)練時(shí),該模型能夠預(yù)測(cè)酵母中這些非編碼序列的變化如何影響基因表達(dá)。他們還設(shè)計(jì)了一種以二維方式表示景觀的獨(dú)特方式,使其易于理解過(guò)去并預(yù)測(cè)酵母以外的生物中非編碼序列的未來(lái)演變——甚至為基因治療和工業(yè)應(yīng)用設(shè)計(jì)定制的基因表達(dá)模式。
“我們現(xiàn)在有一個(gè)‘神諭’,可以詢問(wèn):如果我們嘗試了這個(gè)序列的所有可能突變?cè)趺崔k?或者,我們應(yīng)該設(shè)計(jì)什么樣的新序列來(lái)給我們想要的表達(dá)?” 麻省理工學(xué)院生物學(xué)教授(休假)、哈佛大學(xué)布羅德研究所和麻省理工學(xué)院的核心成員(休假)、基因泰克研究和早期發(fā)展負(fù)責(zé)人、該研究的資深作者Aviv Regev說(shuō)。“科學(xué)家們現(xiàn)在可以使用該模型解決他們自己的進(jìn)化問(wèn)題或場(chǎng)景,以及其他問(wèn)題,例如制作以所需方式控制基因表達(dá)的序列。我也對(duì)對(duì)可解釋性感興趣的機(jī)器學(xué)習(xí)研究人員的可能性感到興奮。他們可以反過(guò)來(lái)問(wèn)他們的問(wèn)題,以更好地了解潛在的生物學(xué)。”
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!