網(wǎng)易互娛AI Lab圖像生成論文被AI頂會(huì)接收
微新創(chuàng)想(idea2003.com)8月8日 消息:網(wǎng)易互娛 AI Lab 的一篇學(xué)術(shù)論文《General Image-to-Image Translation with One-Shot Image Guidance》被國際計(jì)算機(jī)視覺頂級(jí)學(xué)術(shù)會(huì)議 ICCV2023接收。
該論文提出了一種名為 VCT(視覺概念轉(zhuǎn)換器)的圖像編輯技術(shù),可以通過一張參考圖像將物體或風(fēng)格轉(zhuǎn)移到源圖像上,同時(shí)保持源圖像的整體結(jié)構(gòu)不變。
VCT 相比以往的方案有幾個(gè)優(yōu)勢(shì):不需要大量的訓(xùn)練數(shù)據(jù),生成質(zhì)量和泛化性更好;利用圖片進(jìn)行參考引導(dǎo),實(shí)現(xiàn)更準(zhǔn)確的圖片編輯;不需要額外的控制信息,直接從源圖像和參考圖像學(xué)習(xí)結(jié)構(gòu)和語義信息來生成圖像。