打擊AI深度偽造仍無解?研究稱:數字水印保護可被輕松繞過
文章概要:
1. AI生成深度偽造圖像的潛在風險,包括惡意用途和法律挑戰。
2. 研究指出數字水印保護容易被繞過,引發信息泄漏和欺詐問題。
3. 盡管存在挑戰,設計強大的數字水印仍然是應對問題的一種可能解決方案。
微新創想(idea2003.com) 10月9日 消息:近年來,AI技術的發展使得生成深度偽造圖像變得輕而易舉。例如,阿諾德·施瓦辛格的臉被疊加到克林特·伊斯特伍德的《丑牛》電影中。這些深度偽造圖像有時會帶來娛樂,但最近的發展卻引發了更加不安的趨勢,將數字虛假信息轉向了惡意用途。
最近,演員湯姆·漢克斯在社交媒體上譴責一則廣告,該廣告使用了他的AI生成肖像來推廣一項牙科保健計劃。此外,擁有超過50億觀看次數的YouTuber Mr. Beast被虛假地展示為以2美元的價格提供iPhone15Pro。普通市民也成為目標,他們的面孔出現在社交媒體上,而未經他們同意。最令人不安的是“復仇色情”的增加,其中受傷害感情的人發布了虛假的圖像,將前任伴侶描繪成令人尷尬或色情的場景中。
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
為了應對這一問題,主要的數字媒體公司,如OpenAI、Alphabet、亞馬遜和DeepMind,承諾開發工具來打擊虛假信息。其中一個關鍵方法是在AI生成的內容上使用數字水印。然而,一份發表在arXiv預印本服務器上的研究報告指出,要遏制這種數字虛假信息濫用的能力存在困難。
馬里蘭大學的教授進行了測試,展示了保護性水印的輕松繞過方法。其中一位報告作者Soheil Feizi表示:“目前我們沒有可靠的數字水印技術。”他表示,他的團隊都可以成功繞過數字水印技術。他還警告說,AI的誤用可能導致涉及虛假信息、欺詐乃至選舉操縱等潛在危害,這些危害涵蓋了個人和更廣泛社會的傷害。
研究團隊采用了一種稱為“擴散凈化(diffusion purification)”的過程,該過程將高斯噪聲應用于數字水印,然后將其刪除。這留下了一個扭曲的水印,可以繞過檢測算法,而圖像的其余部分幾乎沒有改變。他們還成功地證明,惡意行為者通過訪問黑匣子數字水印算法可以發布帶有標記的虛假照片,以欺騙檢測器認為它們是合法的。
盡管如此,Feizi也表達了一些樂觀情緒,他說:“根據我們的研究結果,設計強大的數字水印是一項具有挑戰性但不一定不可能的任務。”因此,目前人們在審查包含可能對他們重要的內容的圖像時,必須要保持警惕,雙重檢查來源,并運用常識。