這項(xiàng)新研究的作者分析的癌癥 DNA 片段源自人類基因組,其序列源自數(shù)百萬(wàn)年的進(jìn)化,并通過(guò)“復(fù)制-粘貼-編輯”過(guò)程以及與寄生蟲的共同進(jìn)化形成。元素。例如,我們 8% 的 DNA 來(lái)自過(guò)去的病毒感染。
塑造我們基因組的曲折突變過(guò)程在癌細(xì)胞基因組中加劇并危及生命,導(dǎo)致無(wú)政府狀態(tài)的細(xì)胞突變和增殖。
我們基因組中重復(fù)的 DNA 序列不僅是我們過(guò)去進(jìn)化的化石,而且還記錄了癌癥如何進(jìn)化,這有助于科學(xué)家了解和研究癌癥的發(fā)展和進(jìn)展。當(dāng)前的技術(shù)允許科學(xué)家閱讀并拼湊數(shù)十億個(gè)短 DNA 序列,以研究癌癥基因組并識(shí)別其中的突變。但是,人類基因組的一個(gè)基本特征阻礙了這種對(duì)重復(fù) DNA 的探索:如何將通常從同一祖先副本粘貼的短的準(zhǔn)相同序列替換回它們的原始基因組位置?以及如何識(shí)別這些序列中的突變?
最近發(fā)表在 Nature Biotechnology 上的文章利用人工智能的力量來(lái)解決這個(gè)問(wèn)題。將這種新穎的工具應(yīng)用于迄今為止最大的原發(fā)性癌癥基因組集合,已經(jīng)產(chǎn)生了有趣的發(fā)現(xiàn)。例如,即使在眾所周知的癌癥基因的編碼序列中也發(fā)現(xiàn)了用普通工具無(wú)法檢測(cè)到的突變。這意味著攜帶這些突變的癌癥患者可能會(huì)受益于針對(duì)這些基因的治療。在沿著人類基因組重復(fù)多次的基因家族中發(fā)現(xiàn)了其他突變。其中一些家族已經(jīng)與癌癥有關(guān),但無(wú)法觀察到它們的突變。作者已將這一豐富的資源提供給科學(xué)界,這進(jìn)一步豐富了癌癥基因組學(xué)的金礦。
Maxime Tarabichi 及其合作者開發(fā)的算法不僅限于癌癥,也不限于人類基因組。它是使用當(dāng)前測(cè)序技術(shù)生成數(shù)據(jù)的通用工具,全世界所有研究生命進(jìn)化的科學(xué)家都可以使用它。
標(biāo)簽: 人工智能
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!