根據(jù)語言提示生成人體動作的新框架
在過去幾年中,可以自主生成各種類型內容的基于機器學習的模型變得越來越先進。這些框架為制作和編譯數(shù)據(jù)集來訓練機器人算法開辟了新的可能性。
雖然一些現(xiàn)有模型可以根據(jù)文本描述生成逼真或藝術圖像,但迄今為止,開發(fā)能夠根據(jù)人類指令生成移動人物視頻的人工智能更具挑戰(zhàn)性。在預先發(fā)布在服務器arXiv上并在 IEEE/CVF 計算機視覺與模式識別會議 2024 上發(fā)表的論文中,北京理工大學、BIGAI 和北京大學的研究人員介紹了一種有前途的新框架,可以有效地解決這一任務。
“我們之前的工作《HUMANIZE》中的早期實驗表明,通過將任務分解為場景基礎和條件動作生成,兩階段框架可以增強 3D 場景中語言引導的人體動作生成,”該論文的合著者 Yixin Zhu 說。論文,告訴 Tech Xplore。
“機器人領域的一些工作也證明了可供性對模型泛化能力的積極影響,這激勵我們采用場景可供性作為這項復雜任務的中間表示。”
朱和他的同事推出的新框架建立在他們幾年前推出的生成模型之上,稱為 HUMANIZE。研究人員著手提高該模型泛化新問題的能力,例如在學習有效生成“躺在床上”動作后,創(chuàng)建逼真的動作來響應“躺在地板上”的提示。
“我們的方法分兩個階段展開:用于功能可供性圖預測的功能可供性擴散模型 (ADM) 和用于根據(jù)描述和預生成的功能可供性生成人體運動的可供性到運動擴散模型 (AMDM),”Siyuan Huang 聯(lián)合研究人員說道。論文作者解釋說。
“通過利用從人體骨骼關節(jié)和場景表面之間的距離場導出的可供性圖,我們的模型有效地將 3D 場景基礎和該任務中固有的條件運動生成聯(lián)系起來。”
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!
-
6月25-28日,由中國進出境生物安全研究會、中國國際旅行衛(wèi)生保健協(xié)會主辦,中國青年創(chuàng)業(yè)就業(yè)基金會支持,中國出入...瀏覽全文>>
-
胃腸鏡檢查,聽起來可能有些令人不安,但實際上,它可能是生活中的救命稻草。對于一些人來說,定期進行胃腸鏡...瀏覽全文>>
-
6月16日-20日,2025年優(yōu)秀博士后研究人員(紹興)研學活動順利舉行。本次活動匯聚了來自全國各地的百余名博士后,...瀏覽全文>>
-
近日,天津松果生物醫(yī)療科技有限公司自主研發(fā)的牛跟腱來源去端肽I型膠原蛋白原材料成功通過國家藥品監(jiān)督管理局...瀏覽全文>>
-
在數(shù)字化產(chǎn)業(yè)轉型的浪潮奔涌之際,病理學正經(jīng)歷著前所未有的革新機遇。奧偉登(Evident)憑借百年光學技術積淀,以...瀏覽全文>>
-
6月6-8日,CHINAGUT 2025中國腸道大會在寧波國際會議中心隆重舉辦。大會由南京醫(yī)科大學第二附屬醫(yī)院、國家消化...瀏覽全文>>
-
在第28屆北京國際口腔展這一行業(yè)風向標級盛會上,北京易嶺生物科技有限公司(下面簡稱易嶺生物)憑借重磅新品發(fā)...瀏覽全文>>
-
2025款上汽大眾ID 4 X在安徽阜陽地區(qū)的售價會根據(jù)配置和選裝包有所不同?;A版車型的廠商指導價大約在20萬...瀏覽全文>>
-
嵐圖FREE,作為一款集豪華與智能于一體的新能源SUV,正以全新的姿態(tài)迎接每一位渴望高品質出行的用戶?,F(xiàn)在,嵐...瀏覽全文>>
-
安徽阜陽的大眾ARTEON 2022新款現(xiàn)已到店,最低售價從34 80萬元起,無疑是近期購車的最佳時機。這款車型以其...瀏覽全文>>