直接面向消費者的基因檢測使數(shù)以百萬計的人能夠確定他們的血統(tǒng)并深入了解他們對遺傳疾病的遺傳傾向。雖然個人基因分型信息是安全存儲的,但有些人同意共享他們的基因組數(shù)據(jù)以供進一步研究。
這種數(shù)據(jù)共享引起了對基因組隱私的一些合理擔憂。例如,黑客是否可以根據(jù)從開源網(wǎng)絡平臺合法下載的基因型數(shù)據(jù)重新識別一個人——也許構(gòu)建一張他們的臉的照片?
2017 年,基于基因組學的健康情報公司 Human Longevity 和其他研究小組報告說,根據(jù) DNA 預測一個人的面部外觀是可行的。
對這項工作的隱私風險影響很感興趣,圣路易斯華盛頓大學的教職員工 Yevgeniy “Eugene” Vorobeychik 是應用博弈論確定數(shù)據(jù)共享設置中的隱私風險的專家,他進行了自己的研究。
“我們想看看這些結(jié)果能在多大程度上推廣到現(xiàn)實世界,”麥凱維工程學院計算機科學與工程副教授 Vorobeychik 說。“我們探討了是否有可能在更實際的情況下證明這些擔憂是真實的。”
Vorobeychik 和他的合著者——華盛頓大學研究生 Rajagopal Venkatesaramani 和范德比爾特大學生物醫(yī)學信息學教授 Bradley Malin——發(fā)現(xiàn)將人臉和基因組聯(lián)系起來的任務平均比之前報道的要困難得多。他們于2021 年 11 月 17 日在《科學進展》上發(fā)表了他們的發(fā)現(xiàn)。
在這項研究中,他們開發(fā)了一種方法,通過將這些與公開發(fā)布的面部圖像相關(guān)聯(lián),從 OpenSNP 基因組共享平臺獲得的 126 個基因組精心策劃的數(shù)據(jù)集中計算重新識別個體的風險。具體來說,他們使用神經(jīng)網(wǎng)絡模型來預測可見的身體特征,例如頭發(fā)、眼睛和膚色以及性別,然后使用這些信息以及已知的基因型-特征相關(guān)性來對可能的基因組-面部匹配進行評分。
早期的表型關(guān)聯(lián)研究使用在具有專業(yè)質(zhì)量照明的實驗室環(huán)境中拍攝的高質(zhì)量照片。另一方面,Vorobeychik 的團隊使用社交媒體網(wǎng)站上的真實照片進行了研究。
“我們所做的是為這些不同類型的視覺特征構(gòu)建概率模型,并通過對特定基因組和特定面孔之間的匹配質(zhì)量進行評分來基本上連接點,”Vorobeychik 解釋說。“然后我們使用該評分系統(tǒng)來預測哪些比賽最有可能。”
總體而言,他們的結(jié)果表明,有時可以將公共面部圖像與公共基因組數(shù)據(jù)聯(lián)系起來,但成功率遠低于先前研究論文在理想化環(huán)境中所建議的。
標簽:
免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!