你身體中大約 40 萬億個細胞中的大多數(shù)都擁有幾乎相同的基因組拷貝——從你父母那里繼承的 DNA,包含從將食物轉(zhuǎn)化為能量到抵抗感染的所有指令。健康細胞通過基因組中的有害突變變成癌細胞。例如,如果一個細胞的基因組被紫外線損壞,它可能會導致突變,導致細胞無法控制地生長并形成腫瘤。
識別導致健康細胞變成惡性的基因變化可以幫助醫(yī)生選擇專門針對腫瘤的療法。例如,大約 25%的乳腺癌是HER2 陽性的,這意味著這類腫瘤中的細胞會發(fā)生突變,導致它們產(chǎn)生更多的稱為 HER2 的蛋白質(zhì)來幫助它們生長。專門針對HER2 的治療顯著提高了此類乳腺癌的存活率。
科學家們現(xiàn)在可以很容易地讀取細胞 DNA 來識別突變。挑戰(zhàn)在于人類基因組非常龐大,而突變是進化的正常部分。人類基因組的長度足以填滿一本 120 萬頁的書,任何兩個人大約可以擁有300 萬個遺傳差異。在腫瘤中找到一個致癌突變就像在一堆針中找到一根針。
我是一名計算機科學家,他探索大型復(fù)雜的遺傳數(shù)據(jù)集,以回答有關(guān)生物學和疾病的基本問題。我和我的研究團隊最近發(fā)表了一項研究,該研究使用來自數(shù)千名健康人的 DNA,利用自然選擇原理幫助識別致病突變。
利用大數(shù)據(jù)發(fā)現(xiàn)癌變
在確定患者的癌癥突變類型時,金標準是比較患者的兩個樣本:一個來自腫瘤,另一個來自健康組織(通常是血液)。由于兩個樣本都來自同一個人,他們的大部分 DNA 是相同的;只關(guān)注彼此不同的遺傳區(qū)域會大大縮小可能致癌突變的位置。
雖然基因突變是日常生活的一部分,但有些可能會導致癌癥。
問題是健康組織并不總是從患者身上收集,原因從臨床成本到狹窄的研究方案。
解決這個問題的一種方法是查看大量的公共 DNA 數(shù)據(jù)庫。由于癌癥驅(qū)動突變不利于生存,自然選擇往往會隨著時間的推移在連續(xù)幾代中消除它們。在腫瘤的所有突變中,在特定人群中發(fā)生頻率較低的突變比許多人共有的變化更可能有害。經(jīng)過計算這些數(shù)據(jù)庫中突變發(fā)生的頻率,研究人員可以區(qū)分常見且可能是良性的基因變化和罕見且可能癌變的基因變化。
鑒于這種方法的威力,最近出現(xiàn)了大量收集和共享數(shù)百到數(shù)千人的 DNA 序列的項目。這些項目包括1000 基因組計劃、西蒙斯基因組多樣性計劃、GnomAD和All of Us。未來可能還會有更多。
標簽:
免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!