がーるずらっしゅ在线中文,777亚洲熟妇自拍无码区,人妻无码aⅴ不卡中文字幕

當(dāng)我們睜開眼睛時，我們會立即看到周圍的環(huán)境。大腦如何如此快速地形成這些豐富而詳細(xì)的世界表征，是視覺研究中最大的未解之謎之一。

研究大腦的科學(xué)家試圖通過使用計算機視覺模型來復(fù)制這種現(xiàn)象，但迄今為止，領(lǐng)先的模型只執(zhí)行更簡單的任務(wù)，例如在雜亂的背景中拾取物體或人臉?，F(xiàn)在，由麻省理工學(xué)院認(rèn)知科學(xué)家領(lǐng)導(dǎo)的團隊開發(fā)了一個計算機模型，該模型捕捉了人類視覺系統(tǒng)從圖像中快速生成詳細(xì)場景描述的能力，并提供了一些關(guān)于大腦如何實現(xiàn)這一功能的見解。

喬希說：“我們在這項工作中試圖做的是解釋感知比僅僅給圖像的所有部分貼上語義標(biāo)簽要豐富得多，并探索如何看待整個物理世界?！碧啬硝U姆是計算認(rèn)知科學(xué)教授，也是計算機科學(xué)和人工智能實驗室(CSAIL)和麻省理工學(xué)院大腦、思維和機器中心(CBMM)的成員。

新模型假設(shè)，當(dāng)大腦接收到視覺輸入時，它將快速執(zhí)行一系列計算，從而逆轉(zhuǎn)了計算機圖形程序用來生成人臉或其他對象的2D表示的步驟。研究人員表示，這種被稱為有效逆圖(EIG)的模型，與非人類靈長類大腦面部選定區(qū)域的電記錄也有很好的相關(guān)性，這表明靈長類視覺系統(tǒng)的組織方式幾乎與計算機模型相同。

這篇論文的主要作者是前麻省理工學(xué)院博士后伊爾克耶爾德勒姆(Ilker Yildirim)，他現(xiàn)在是耶魯大學(xué)的心理學(xué)助理教授。論文今天發(fā)表在《科學(xué)進展》。洛克菲勒大學(xué)的神經(jīng)科學(xué)和行為學(xué)教授特南鮑姆和溫里奇弗賴瓦爾德是這項研究的資深作者。耶魯大學(xué)研究生馬里奧貝勒東也是一名作家。

反向圖形

幾十年來，對大腦視覺系統(tǒng)的研究已經(jīng)非常詳細(xì)地研究了如何將入射到視網(wǎng)膜上的光轉(zhuǎn)換成內(nèi)聚場景。這種理解有助于人工智能研究人員開發(fā)能夠復(fù)制系統(tǒng)所有方面的計算機模型，例如識別人臉或其他物體。

特南鮑姆說：“視覺是我們對人類和其他動物最了解的大腦功能方面?！薄澳壳?，計算機視覺是AI最成功的領(lǐng)域之一。我們相信，機器現(xiàn)在可以很好地觀察圖片，很好地識別人臉，并檢測其他種類的物體?！?

然而，即使是這些復(fù)雜的人工智能系統(tǒng)也無法與人類視覺系統(tǒng)實現(xiàn)的功能相比。

他說：“我們的大腦不僅會檢測那里的物體，而且不會識別和標(biāo)記它們。”“我們看到了所有的形狀、幾何形狀、表面和紋理。我們看到了一個非常富裕的世界?！?

一個多世紀(jì)前，醫(yī)生、物理學(xué)家和哲學(xué)家赫爾曼赫爾姆霍茨提出了這樣一個理論，即大腦通過逆轉(zhuǎn)圖像形成過程來創(chuàng)造這些豐富的表征。他假設(shè)視覺系統(tǒng)包括一個圖像生成器，例如，它將用于生成我們在夢中看到的面孔。研究人員說，反向運行發(fā)電機將使大腦從圖像向后移動，并推斷哪種臉或其他物體會產(chǎn)生圖像。

然而，問題仍然存在：大腦如何如此快速地執(zhí)行這個過程(稱為逆圖形)？科學(xué)家們試圖創(chuàng)造一種能夠執(zhí)行這一任務(wù)的算法，但在過去，最好的系統(tǒng)需要許多循環(huán)的迭代處理，這比大腦創(chuàng)建你所看到的詳細(xì)視覺表示所需的100到200毫秒要長得多。神經(jīng)科學(xué)家認(rèn)為，大腦的感知之所以能夠如此迅速地進行，是因為它是通過前饋傳遞和神經(jīng)處理的幾個層級組織層來實現(xiàn)的。

麻省理工學(xué)院領(lǐng)導(dǎo)的團隊著手構(gòu)建一個特殊的深度神經(jīng)網(wǎng)絡(luò)模型，展示神經(jīng)層次如何快速推斷場景的基本特征——在這種情況下，是特定的人臉。與計算機視覺中使用的標(biāo)準(zhǔn)深度神經(jīng)網(wǎng)絡(luò)相反，后者是從表示圖像中對象類別的標(biāo)記數(shù)據(jù)中訓(xùn)練的，而研究人員的網(wǎng)絡(luò)是通過反映大腦中能夠表達面部表情的場景的內(nèi)部表示的模型來訓(xùn)練的。看起來。

因此，他們的模型學(xué)會了逆轉(zhuǎn)由計算機圖形程序執(zhí)行的生成人臉的步驟。這些圖形程序從單個面部的三維表示開始，然后將其轉(zhuǎn)換為二維圖像(從特定的視點)。這些圖像可以放在任何背景圖像上。研究人員認(rèn)為，當(dāng)你做夢或聯(lián)想到某人面部的心理圖像時，大腦的視覺系統(tǒng)可能會執(zhí)行類似的操作。

研究人員訓(xùn)練他們的深層神經(jīng)網(wǎng)絡(luò)以相反的方式執(zhí)行這些步驟——也就是說，它從2D圖像開始，然后添加紋理、曲率和光照等功能，以創(chuàng)建研究人員所說的“2.5D”。這些2.5D圖像從特定角度指定面部的形狀和顏色。然后將它們轉(zhuǎn)換為獨立于視點的3D表示。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險自擔(dān)。如有侵權(quán)請聯(lián)系刪除！

科學(xué)家開發(fā)了一種用于人臉識別的計算機模型

猜你喜歡

最新文章