隨著澳大利亞和北美研究人員開發(fā)的新開源數(shù)據(jù)庫的發(fā)布,共享揭示基因組變異在健康和疾病中的功能的數(shù)據(jù)集變得更加容易。
MaveDB數(shù)據(jù)庫是存儲(chǔ)來自實(shí)驗(yàn)數(shù)據(jù)的數(shù)據(jù)的存儲(chǔ)庫(稱為突變效應(yīng)的多重測(cè)量)。該系統(tǒng)可以系統(tǒng)地測(cè)量數(shù)千個(gè)單序列變異對(duì)基因功能的影響。這些實(shí)驗(yàn)可以提供有價(jià)值的信息,說明該基因產(chǎn)生的蛋白質(zhì)是如何發(fā)揮作用的,該基因的變體是如何引起疾病的,以及如何設(shè)計(jì)一種比原始蛋白質(zhì)更有效的天然蛋白質(zhì)的合成形式。
MaveDB是第一個(gè)可以公開訪問這些數(shù)據(jù)的數(shù)據(jù)庫。它的發(fā)展由澳大利亞沃爾特和伊萊扎霍爾學(xué)院的艾倫魯賓博士、美國(guó)華盛頓大學(xué)副教授道格拉斯福勒和加拿大多倫多大學(xué)的弗雷德里克羅斯教授領(lǐng)導(dǎo)。MaveDB在今天的《基因組生物學(xué)》雜志中有描述。
乍一看
新開發(fā)的數(shù)據(jù)庫MaveDB增強(qiáng)了復(fù)雜功能基因組數(shù)據(jù)集的共享。
MaveDB是一個(gè)易于使用的存儲(chǔ)庫,用于存儲(chǔ)來自多次突變效應(yīng)分析(MAVE)的數(shù)據(jù),用于解釋窮盡測(cè)量不同基因突變效應(yīng)的實(shí)驗(yàn)結(jié)果。
MaveDB增強(qiáng)了研究人員獲取和解釋復(fù)雜功能基因組數(shù)據(jù)的能力,從而加快了對(duì)基因的基礎(chǔ)生物學(xué)、基因在疾病中的作用以及如何工程蛋白質(zhì)以創(chuàng)造更有效的變體的研究。
加強(qiáng)基因組學(xué)研究
魯賓博士說,MAVE徹底改變了研究人員理解基因功能及其在疾病中的作用的能力。
他說:“過去,研究人員必須關(guān)注基因的一些變化,才能了解它們的功能?!彼f:“通過徹底掃描可能有數(shù)百或數(shù)千個(gè)堿基的基因變異來生成數(shù)據(jù)太復(fù)雜了。
“微型飛行器的發(fā)展為研究人員提供了一種方法,通過實(shí)驗(yàn)來測(cè)量基因的每個(gè)個(gè)體遺傳變化及其功能后果。這些檢測(cè)方法可以處理成千上萬的基因變異,這樣研究人員就可以探索相關(guān)的變化,并將其放在背景中”。
迄今為止,來自實(shí)驗(yàn)的MAVE數(shù)據(jù)是孤立存在的。當(dāng)研究論文發(fā)表或應(yīng)要求提供給其他研究人員時(shí),個(gè)別研究的數(shù)據(jù)將被上傳到期刊網(wǎng)站。
魯賓博士說:“這使得研究人員很難獲得其他群體的數(shù)據(jù),甚至很難知道已經(jīng)進(jìn)行了一項(xiàng)特定的MAVE實(shí)驗(yàn)。因此,這可能會(huì)阻礙合作和基因組學(xué)研究的進(jìn)展?!?
“MaveDB采用了一種適用于多個(gè)研究領(lǐng)域的靈活格式,這使得科學(xué)家可以更容易地在一個(gè)地方共享他們的數(shù)據(jù)集,并使其他科學(xué)家能夠輕松訪問這些數(shù)據(jù)以增強(qiáng)他們的研究。我們還確保MaveDB可以“與其他數(shù)據(jù)庫對(duì)話”以增加協(xié)作。對(duì)于不斷增長(zhǎng)的MAVE研究領(lǐng)域來說,通過確保數(shù)據(jù)的可用性,數(shù)據(jù)庫是邁向開放科學(xué)和可重復(fù)性的重要一步。"
從MAVE獲得的數(shù)據(jù)有許多應(yīng)用,包括了解基因或蛋白質(zhì)的功能,測(cè)量遺傳變異在疾病中的參與程度,或了解如何使合成蛋白質(zhì)(如生物技術(shù)中使用的蛋白質(zhì))更有效。
視覺數(shù)據(jù)
除了建立MaveDB,該團(tuán)隊(duì)還開發(fā)了一個(gè)名為MaveVis的數(shù)據(jù)可視化軟件,使研究人員更容易理解和解釋MAVED實(shí)驗(yàn)的結(jié)果。
Rubin博士說:“Mavevis提供了MaveVis數(shù)據(jù)的即時(shí)和一致顯示,包括有價(jià)值的注釋(如蛋白質(zhì)結(jié)構(gòu)信息),這將加速協(xié)作研究。”
“我們?cè)O(shè)想,隨著MaveDB在生物信息學(xué)領(lǐng)域的廣泛應(yīng)用,還會(huì)增加其他應(yīng)用,這將為可視化和解釋復(fù)雜的基因組學(xué)數(shù)據(jù)提供新的方法——從而帶來新的發(fā)現(xiàn),以增強(qiáng)生物醫(yī)學(xué)研究。這可能會(huì)支持新藥的開發(fā),或者理解患者的基因組變異是如何導(dǎo)致疾病的?!?
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!