LG 推出 Captioning AI 的生成式 AI 服務:像人類一樣為圖像生成描述和關鍵字
站長之家(ChinaZ.com) 6月20日消息:LG 發布了一款名為 Captioning AI 的生成式 AI 服務,該服務可以識別圖像中的元素并生成描述和關鍵詞,引發了對這家韓國企業如何影響市場的期望,因為生成式 AI 服務(如 ChatGPT)正在推動變革。
LG AI 研究部門在周日(當地時間)在加拿大溫哥華舉行的全球最大計算機視覺會議「計算機視覺與模式識別 2023」上發布了 Captioning AI 服務。
LG 表示,該服務基于 LG AI 研究部門的 Zero-shot Image Captioning 技術,這是一種使 AI 能夠通過先前的經驗和知識理解和描述它第一次看到的對象或場景的技術,就像人類一樣。
該公司解釋說,Captioning AI 與 Midjourney 等 AI 服務不同,后者需要用戶輸入文本或插入圖像文件,然后 AI 繪制圖片。
LG 公司的一位發言人表示:「字幕看起來很簡單,因為這是一個古老的概念,但將生成式 AI 技術應用于字幕的想法是,AI 具有對其以前沒有見過的圖像進行推理的視覺智能。例如,它可以觀察圖像中的風景或人物,并推斷出位置。」
研究人員表示,Captioning AI 可以在不到兩天的時間內為 1 萬張圖像生成文本描述和關鍵詞,這可以提高需要管理大量圖像的公司的工作效率和生產力。
該服務是通過與 Shutterstock 的合作實現的,Shutterstock 是包括圖像和視頻在內的全球最大的視覺內容平臺。LG AI 研究與這家總部位于美國的公司合作,后者在圖像捕捉方面擁有豐富的專業知識。
雙方還在確保版權透明性和驗證 AI 倫理方面進行了合作,例如 AI 在學習圖像時是否以有偏見的方式收集數據等問題。
LG AI 研究的 Vision Lab 負責人 Kim Seung-hwan 表示:「為了在圖像捕捉領域確立全球研究領導地位,我們計劃通過與各種合作伙伴建立有機合作關系,持續開發新的度量標準并研究新技術。」
在會議期間,LG 集團旗下的子公司,如 LG AI 研究、LG 電子、LG Innotek、LG Energy Solution 和 LG UPlus,舉辦了 LG AI Day,這是一次針對研究生的招聘活動。