在我們當(dāng)前的人工智能時代,計算機可以通過擴散模型生成自己的“藝術(shù)”,迭代地向嘈雜的初始狀態(tài)添加結(jié)構(gòu),直到出現(xiàn)清晰的圖像或視頻。
擴散模型突然在每個人的餐桌上占據(jù)了一席之地:輸入幾個詞,在現(xiàn)實與幻想的交匯處體驗瞬間的、令人多巴胺飆升的夢境。在幕后,它涉及一個復(fù)雜、耗時的過程,需要算法進(jìn)行多次迭代才能完善圖像。
麻省理工學(xué)院計算機科學(xué)和人工智能實驗室(CSAIL)的研究人員推出了一種新框架,將傳統(tǒng)擴散模型的多步驟過程簡化為單個步驟,解決了以前的局限性。這是通過一種師生模型來完成的:教授一個新的計算機模型來模仿生成圖像的更復(fù)雜的原始模型的行為。
該方法稱為分布匹配蒸餾 (DMD),可以保留生成圖像的質(zhì)量并允許更快的生成速度。
麻省理工學(xué)院博士 Tianwei Yin 表示:“我們的工作是一種新穎的方法,可以將穩(wěn)定擴散和 DALLE-3 等現(xiàn)有擴散模型加速 30 倍。”電氣工程和計算機科學(xué)專業(yè)的學(xué)生、CSAIL 附屬機構(gòu)和 DMD 框架的首席研究員。
“這一進(jìn)步不僅顯著減少了計算時間,而且保留了(如果不是超越的話)生成的視覺內(nèi)容的質(zhì)量。理論上,該方法將生成對抗網(wǎng)絡(luò)(GAN)的原理與擴散模型的原理結(jié)合起來,實現(xiàn)了視覺內(nèi)容的生成“一步——與當(dāng)前擴散模型所需的數(shù)百步迭代細(xì)化形成鮮明對比。它可能是一種在速度和質(zhì)量方面都表現(xiàn)出色的新生成建模方法。”
這種單步擴散模型可以增強設(shè)計工具,實現(xiàn)更快的內(nèi)容創(chuàng)建,并有可能支持藥物發(fā)現(xiàn)和 3D 建模的進(jìn)步,其中及時性和有效性是關(guān)鍵。
分銷夢想
DMD 巧妙地具有兩個組件。首先,它使用回歸損失,錨定映射以確保圖像空間的粗略組織,從而使訓(xùn)練更加穩(wěn)定。
接下來,它使用分布匹配損失,確保使用學(xué)生模型生成給定圖像的概率與其真實世界的出現(xiàn)頻率相對應(yīng)。為此,它利用兩個擴散模型作為指導(dǎo),幫助系統(tǒng)了解真實圖像和生成圖像之間的差異,并使訓(xùn)練快速的一步生成器成為可能。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!