奧蘭多,2021 年 9 月 8 日——根據一項新的研究,世界上最大的野生植物、動物和真菌原始基因組序列存儲庫缺少監(jiān)測和保護地球生物多樣性所需的關鍵數據。
缺失的數據包括收集有機體樣本的時間和地點,這是監(jiān)測種群遺傳多樣性所必需的。
該研究最近發(fā)表在《美國國家科學院院刊》上。
Michelle Gaither 是 UCF 生物學系的助理教授,也是這項新研究的合著者。
“大量資金被用于生成這些基因組數據,但由于缺乏元數據,大多數對生物多樣性監(jiān)測沒有用處,”UCF生物學系助理教授、該研究的合著者米歇爾蓋瑟說。“時空元數據缺失造成的投資損失總計數千萬美元,而且這個數額只會增加。”
該存儲庫 - 國際核苷酸序列數據庫合作的序列讀取檔案 (SRA) - 是原始基因組序列的領先集合,其中包含來自全球野生植物、動物和真菌物種的超過 600 TB 的數據??茖W家們繼續(xù)以指數速度將基因組數據存入 SRA。
“然而,如果沒有時間和位置元數據,我們就無法監(jiān)測遺傳多樣性的變化,”蓋瑟說。
在這項研究中,研究人員對 SRA 中的公開數據進行了搜索。他們評估了 SRA 數據在監(jiān)測生物多樣性方面的潛在用途,發(fā)現大多數存檔的基因組數據集缺乏遺傳生物多樣性監(jiān)測所需的時間和空間元數據,只有 14% 的 SRA 數據集包含有關生物體采樣時間和地點的信息。
研究人員隨后對缺少緯度和經度坐標的野生種群的 800 多個數據集進行了勞動密集型搜索,以填補缺失的數據。他們的活動聯系了為資料庫做出貢獻以收集數據的科學家。盡管做出了這些努力,該團隊只能獲得大約 33% 的 SRA 數據集的地理空間坐標和收集年份。
標簽:
免責聲明:本文由用戶上傳,與本網站立場無關。財經信息僅供讀者參考,并不構成投資建議。投資者據此操作,風險自擔。 如有侵權請聯系刪除!