奧蘭多,2021 年 9 月 8 日——根據(jù)一項新的研究,世界上最大的野生植物、動物和真菌原始基因組序列存儲庫缺少監(jiān)測和保護地球生物多樣性所需的關鍵數(shù)據(jù)。
缺失的數(shù)據(jù)包括收集有機體樣本的時間和地點,這是監(jiān)測種群遺傳多樣性所必需的。
該研究最近發(fā)表在《美國國家科學院院刊》上。
Michelle Gaither 是 UCF 生物學系的助理教授,也是這項新研究的合著者。
“大量資金被用于生成這些基因組數(shù)據(jù),但由于缺乏元數(shù)據(jù),大多數(shù)對生物多樣性監(jiān)測沒有用處,”UCF生物學系助理教授、該研究的合著者米歇爾蓋瑟說。“時空元數(shù)據(jù)缺失造成的投資損失總計數(shù)千萬美元,而且這個數(shù)額只會增加。”
該存儲庫 - 國際核苷酸序列數(shù)據(jù)庫合作的序列讀取檔案 (SRA) - 是原始基因組序列的領先集合,其中包含來自全球野生植物、動物和真菌物種的超過 600 TB 的數(shù)據(jù)??茖W家們繼續(xù)以指數(shù)速度將基因組數(shù)據(jù)存入 SRA。
“然而,如果沒有時間和位置元數(shù)據(jù),我們就無法監(jiān)測遺傳多樣性的變化,”蓋瑟說。
在這項研究中,研究人員對 SRA 中的公開數(shù)據(jù)進行了搜索。他們評估了 SRA 數(shù)據(jù)在監(jiān)測生物多樣性方面的潛在用途,發(fā)現(xiàn)大多數(shù)存檔的基因組數(shù)據(jù)集缺乏遺傳生物多樣性監(jiān)測所需的時間和空間元數(shù)據(jù),只有 14% 的 SRA 數(shù)據(jù)集包含有關生物體采樣時間和地點的信息。
研究人員隨后對缺少緯度和經(jīng)度坐標的野生種群的 800 多個數(shù)據(jù)集進行了勞動密集型搜索,以填補缺失的數(shù)據(jù)。他們的活動聯(lián)系了為資料庫做出貢獻以收集數(shù)據(jù)的科學家。盡管做出了這些努力,該團隊只能獲得大約 33% 的 SRA 數(shù)據(jù)集的地理空間坐標和收集年份。
標簽:
免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!