霽彩華年,因夢同行—— 慶祝深圳霽因生物醫(yī)藥轉(zhuǎn)化研究院成立十周年 情緒益生菌PS128助力孤獨(dú)癥治療,權(quán)威研究顯示可顯著改善孤獨(dú)癥癥狀 PARP抑制劑氟唑帕利助力患者從維持治療中獲益,改寫晚期卵巢癌治療格局 新東方智慧教育發(fā)布“東方創(chuàng)科人工智能開發(fā)板2.0” 精準(zhǔn)血型 守護(hù)生命 腸道超聲可用于檢測兒童炎癥性腸病 迷走神經(jīng)刺激對抑郁癥有積極治療作用 探索梅尼埃病中 MRI 描述符的性能和最佳組合 自閉癥患者中癡呆癥的患病率增加 超聲波 3D 打印輔助神經(jīng)源性膀胱的骶神經(jīng)調(diào)節(jié) 胃食管反流病患者耳鳴風(fēng)險(xiǎn)增加 間質(zhì)性膀胱炎和膀胱疼痛綜合征的臨床表現(xiàn)不同 研究表明 多語言能力可提高自閉癥兒童的認(rèn)知能力 科學(xué)家揭示人類與小鼠在主要癌癥免疫治療靶點(diǎn)上的驚人差異 利用正確的成像標(biāo)準(zhǔn)改善對腦癌結(jié)果的預(yù)測 地中海飲食通過腸道細(xì)菌變化改善記憶力 讓你在 2025 年更健康的 7 種驚人方法 為什么有些人的頭發(fā)和指甲比其他人長得快 物質(zhì)的使用會(huì)改變大腦的結(jié)構(gòu)嗎 飲酒如何影響你的健康 20個(gè)月,3大平臺(tái),300倍!元育生物以全左旋蝦青素引領(lǐng)合成生物新紀(jì)元 從技術(shù)困局到創(chuàng)新錨點(diǎn),天與帶來了一場屬于養(yǎng)老的“情緒共振” “華潤系”大動(dòng)作落槌!昆藥集團(tuán)完成收購華潤圣火 十七載“冬至滋補(bǔ)節(jié)”,東阿阿膠將品牌營銷推向新高峰 150個(gè)國家承認(rèn)巴勒斯坦國意味著什么 中國海警對非法闖仁愛礁海域菲船只采取管制措施 國家四級救災(zāi)應(yīng)急響應(yīng)啟動(dòng) 涉及福建、廣東 女生查分查出608分后,上演取得理想成績“三件套” 多吃紅色的櫻桃能補(bǔ)鐵、補(bǔ)血? 中國代表三次回?fù)裘婪焦糁肛?zé) 探索精神健康前沿|情緒益生菌PS128閃耀寧波醫(yī)學(xué)盛會(huì),彰顯科研實(shí)力 圣美生物:以科技之光,引領(lǐng)肺癌早篩早診新時(shí)代 神經(jīng)干細(xì)胞移植有望治療慢性脊髓損傷 一種簡單的血漿生物標(biāo)志物可以預(yù)測患有肥胖癥青少年的肝纖維化 嬰兒的心跳可能是他們說出第一句話的關(guān)鍵 研究發(fā)現(xiàn)基因檢測正成為主流 血液測試顯示心臟存在排斥風(fēng)險(xiǎn) 無需提供組織樣本 假體材料有助于減少靜脈導(dǎo)管感染 研究發(fā)現(xiàn)團(tuán)隊(duì)運(yùn)動(dòng)對孩子的大腦有很大幫助 研究人員開發(fā)出診斷 治療心肌炎的決策途徑 兩項(xiàng)研究評估了醫(yī)療保健領(lǐng)域人工智能工具的發(fā)展 利用女子籃球隊(duì)探索足部生物力學(xué) 抑制前列腺癌細(xì)胞:雄激素受體可以改變前列腺的正常生長 肽抗原上的反應(yīng)性半胱氨酸可能開啟新的癌癥免疫治療可能性 研究人員發(fā)現(xiàn)新基因療法可以緩解慢性疼痛 研究人員揭示 tisa-cel 療法治療復(fù)發(fā)或難治性 B 細(xì)胞淋巴瘤的風(fēng)險(xiǎn) 適量飲酒可降低高危人群罹患嚴(yán)重心血管疾病的風(fēng)險(xiǎn) STIF科創(chuàng)節(jié)揭曉獎(jiǎng)項(xiàng),新東方智慧教育榮膺雙料殊榮 中科美菱發(fā)布2025年產(chǎn)品戰(zhàn)略布局!技術(shù)方向支撐產(chǎn)品生態(tài)縱深! 從雪域高原到用戶口碑 —— 復(fù)方塞隆膠囊的品質(zhì)之旅
您的位置:首頁 >要聞 >

科學(xué)家開發(fā)了一種用于人臉識別的計(jì)算機(jī)模型

當(dāng)我們睜開眼睛時(shí),我們會(huì)立即看到周圍的環(huán)境。大腦如何如此快速地形成這些豐富而詳細(xì)的世界表征,是視覺研究中最大的未解之謎之一。

研究大腦的科學(xué)家試圖通過使用計(jì)算機(jī)視覺模型來復(fù)制這種現(xiàn)象,但迄今為止,領(lǐng)先的模型只執(zhí)行更簡單的任務(wù),例如在雜亂的背景中拾取物體或人臉?,F(xiàn)在,由麻省理工學(xué)院認(rèn)知科學(xué)家領(lǐng)導(dǎo)的團(tuán)隊(duì)開發(fā)了一個(gè)計(jì)算機(jī)模型,該模型捕捉了人類視覺系統(tǒng)從圖像中快速生成詳細(xì)場景描述的能力,并提供了一些關(guān)于大腦如何實(shí)現(xiàn)這一功能的見解。

喬希說:“我們在這項(xiàng)工作中試圖做的是解釋感知比僅僅給圖像的所有部分貼上語義標(biāo)簽要豐富得多,并探索如何看待整個(gè)物理世界?!碧啬硝U姆是計(jì)算認(rèn)知科學(xué)教授,也是計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)和麻省理工學(xué)院大腦、思維和機(jī)器中心(CBMM)的成員。

新模型假設(shè),當(dāng)大腦接收到視覺輸入時(shí),它將快速執(zhí)行一系列計(jì)算,從而逆轉(zhuǎn)了計(jì)算機(jī)圖形程序用來生成人臉或其他對象的2D表示的步驟。研究人員表示,這種被稱為有效逆圖(EIG)的模型,與非人類靈長類大腦面部選定區(qū)域的電記錄也有很好的相關(guān)性,這表明靈長類視覺系統(tǒng)的組織方式幾乎與計(jì)算機(jī)模型相同。

這篇論文的主要作者是前麻省理工學(xué)院博士后伊爾克耶爾德勒姆(Ilker Yildirim),他現(xiàn)在是耶魯大學(xué)的心理學(xué)助理教授。論文今天發(fā)表在《科學(xué)進(jìn)展》。洛克菲勒大學(xué)的神經(jīng)科學(xué)和行為學(xué)教授特南鮑姆和溫里奇弗賴瓦爾德是這項(xiàng)研究的資深作者。耶魯大學(xué)研究生馬里奧貝勒東也是一名作家。

反向圖形

幾十年來,對大腦視覺系統(tǒng)的研究已經(jīng)非常詳細(xì)地研究了如何將入射到視網(wǎng)膜上的光轉(zhuǎn)換成內(nèi)聚場景。這種理解有助于人工智能研究人員開發(fā)能夠復(fù)制系統(tǒng)所有方面的計(jì)算機(jī)模型,例如識別人臉或其他物體。

特南鮑姆說:“視覺是我們對人類和其他動(dòng)物最了解的大腦功能方面?!薄澳壳埃?jì)算機(jī)視覺是AI最成功的領(lǐng)域之一。我們相信,機(jī)器現(xiàn)在可以很好地觀察圖片,很好地識別人臉,并檢測其他種類的物體。”

然而,即使是這些復(fù)雜的人工智能系統(tǒng)也無法與人類視覺系統(tǒng)實(shí)現(xiàn)的功能相比。

他說:“我們的大腦不僅會(huì)檢測那里的物體,而且不會(huì)識別和標(biāo)記它們?!薄拔覀兛吹搅怂械男螤睢缀涡螤?、表面和紋理。我們看到了一個(gè)非常富裕的世界?!?

一個(gè)多世紀(jì)前,醫(yī)生、物理學(xué)家和哲學(xué)家赫爾曼赫爾姆霍茨提出了這樣一個(gè)理論,即大腦通過逆轉(zhuǎn)圖像形成過程來創(chuàng)造這些豐富的表征。他假設(shè)視覺系統(tǒng)包括一個(gè)圖像生成器,例如,它將用于生成我們在夢中看到的面孔。研究人員說,反向運(yùn)行發(fā)電機(jī)將使大腦從圖像向后移動(dòng),并推斷哪種臉或其他物體會(huì)產(chǎn)生圖像。

然而,問題仍然存在:大腦如何如此快速地執(zhí)行這個(gè)過程(稱為逆圖形)?科學(xué)家們試圖創(chuàng)造一種能夠執(zhí)行這一任務(wù)的算法,但在過去,最好的系統(tǒng)需要許多循環(huán)的迭代處理,這比大腦創(chuàng)建你所看到的詳細(xì)視覺表示所需的100到200毫秒要長得多。神經(jīng)科學(xué)家認(rèn)為,大腦的感知之所以能夠如此迅速地進(jìn)行,是因?yàn)樗峭ㄟ^前饋傳遞和神經(jīng)處理的幾個(gè)層級組織層來實(shí)現(xiàn)的。

麻省理工學(xué)院領(lǐng)導(dǎo)的團(tuán)隊(duì)著手構(gòu)建一個(gè)特殊的深度神經(jīng)網(wǎng)絡(luò)模型,展示神經(jīng)層次如何快速推斷場景的基本特征——在這種情況下,是特定的人臉。與計(jì)算機(jī)視覺中使用的標(biāo)準(zhǔn)深度神經(jīng)網(wǎng)絡(luò)相反,后者是從表示圖像中對象類別的標(biāo)記數(shù)據(jù)中訓(xùn)練的,而研究人員的網(wǎng)絡(luò)是通過反映大腦中能夠表達(dá)面部表情的場景的內(nèi)部表示的模型來訓(xùn)練的??雌饋?。

因此,他們的模型學(xué)會(huì)了逆轉(zhuǎn)由計(jì)算機(jī)圖形程序執(zhí)行的生成人臉的步驟。這些圖形程序從單個(gè)面部的三維表示開始,然后將其轉(zhuǎn)換為二維圖像(從特定的視點(diǎn))。這些圖像可以放在任何背景圖像上。研究人員認(rèn)為,當(dāng)你做夢或聯(lián)想到某人面部的心理圖像時(shí),大腦的視覺系統(tǒng)可能會(huì)執(zhí)行類似的操作。

研究人員訓(xùn)練他們的深層神經(jīng)網(wǎng)絡(luò)以相反的方式執(zhí)行這些步驟——也就是說,它從2D圖像開始,然后添加紋理、曲率和光照等功能,以創(chuàng)建研究人員所說的“2.5D”。這些2.5D圖像從特定角度指定面部的形狀和顏色。然后將它們轉(zhuǎn)換為獨(dú)立于視點(diǎn)的3D表示。

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!

最新文章