谷歌被指控竊取數百萬用戶數據訓練人工智能工具
站長之家(ChinaZ.com)7月12日 消息:日前,谷歌面臨一項廣泛的侵權訴訟,指控這家科技巨頭未經用戶同意,竊取了數百萬用戶的數據,并違反版權法來訓練和開發其人工智能產品。
這起對谷歌、其母公司 Alphabet 和其人工智能子公司 DeepMind 的集體訴訟于周二在加利福尼亞州的聯邦法院提起,由克拉克森律師事務所提出。該律所上個月曾對 ChatGPT 制造商 OpenAI 提起類似訴訟。
該投訴指控谷歌 “一直在秘密竊取數以百萬計的美國人在互聯網上創造和分享的一切內容”,并利用這些數據來訓練其人工智能產品,例如其聊天機器人 Bard。投訴還聲稱,谷歌獲取了 “我們數字足跡的幾乎全部內容”,包括 “創意和受版權保護的作品”,以構建其人工智能產品。
谷歌、Alphabet 和 DeepMind 的代表尚未作出回應。
投訴引用了谷歌最近的隱私政策更新,明確指出公司可能使用公開可訪問的信息來訓練其人工智能模型和工具,如 Bard。該公司表示,其政策 “一直都明確表示谷歌使用來自開放網絡的公開可獲得信息來訓練諸如 Google 翻譯之類的語言模型。此次更新只是明確了新服務如 Bard 也包含在內。”
這起訴訟是在最近幾個月新一批人工智能工具因其能夠根據用戶提示生成文字和圖像而引起極大關注之際提起的。支撐這一新技術的大型語言模型通過在大量在線數據中進行訓練來實現的。
然而,據谷歌訴訟指出,這一過程中,公司也因從這些數據集中涉及版權問題的作品以及其明顯使用普通用戶(包括兒童)的個人和可能涉及敏感信息的數據而受到越來越多的法律審查。
克拉克森律師事務所的律師之一蒂姆喬達諾(Tim Giordano)表示:“谷歌需要明白‘公開可獲得’從來不意味著可以免費用于任何目的。我們的個人信息和數據是我們的財產,它具有價值,沒有人有權拿走它并將其用于任何目的。”
該訴訟請求采取措施凍結谷歌的生成型人工智能工具(如 Bard)的商業訪問和商業開發,以獲得臨時救濟。它還尋求對谷歌據稱不當使用其數據的人們提供未指定的損害賠償和支付金錢補償。該律所表示已經有八名原告,其中包括一名未成年人。
喬達諾將谷歌通常索引在線數據以支持其核心搜索引擎的好處與其據稱竊取數據來訓練人工智能工具的新指控進行了對比。他說,通過搜索引擎,谷歌可以 “提供一個帶有對作品的屬性鏈接,實際上可以促使某人購買或與之互動”。然而,用于訓練人工智能工具的數據爬取正在創建 “作品的一種替代版本,從根本上改變了任何人購買作品的動機”。
該律所合伙人瑞安克拉克森(Ryan Clarkson)表示,谷歌需要 “為人們提供拒絕的機會”,即不讓他們的數據用于訓練人工智能,同時仍然保持其日常使用互聯網的能力。