BBC 正在阻止 OpenAI 數據抓取:計劃與企業合作找出生成式 AI 最佳用途
微新創想(idea2003.com) 10月7日消息:英國最大的新聞機構 BBC 已經明確了其在評估生成式人工智能使用時將遵循的原則,包括用于新聞研究和制作、檔案和「個性化體驗」。
圖片來自 BBC
BBC 國家總監 Rhodri Talfan Davies 在一篇博客文章中表示,該廣播公司相信這項技術提供了向「我們的受眾和社會提供更多價值」的機會。
Rhodri Talfan Davies 表示,創新一直是 BBC 的核心。從 1922 年的首次廣播到 20 世紀 60 年代的彩色電視,再到過去 25 年中我們在線和移動服務的快速發展,創新推動著 BBC 的每一步發展。
每當 BBC 擁抱新技術時,我們都會把我們的價值觀放在首位。我們希望利用新技術造福所有受眾,幫助我們以嶄新而令人興奮的方式履行公共使命。不僅如此,我們還希望積極影響新技術的發展,以支持提供值得信賴的公共媒體和信息。
生成式人工智能(Gen AI)的出現預計將預示著新一輪的技術革新,它幾乎可以影響人類活動的每一個領域。新工具可以根據用戶的提示生成文本、圖像、語音、音樂和視頻。目前的功能令人印象深刻,而且預計還會迅速發展。您可能聽說過其中的一些工具,如 ChatGPT 或 Midjourney,它們是其中最著名的兩種。
有鑒于此,今天 BBC 概述三項原則,這些原則將決定與 Gen AI 的合作方式:
我們將始終以公眾的最大利益為出發點——我們將探索如何利用生成式人工智能來加強我們的公共使命,并為受眾提供更大的價值。同時,我們將努力減輕生成式人工智能可能帶來的挑戰,包括媒體信任、版權保護和內容發現。我們還將尋求與科技行業、媒體合作伙伴和監管機構合作,倡導在開發創世人工智能的過程中保持安全和透明,并防止造成社會危害。
我們將始終優先考慮人才和創造力——任何技術都無法復制或取代人類的創造力。我們將始終優先考慮并表彰在各自領域最出色的記者、作家和廣播員所講述的真實的、人性化的故事。我們將與他們合作,探索如何利用生成式人工智能來幫助他們開拓新的領域。創作者和供應商在我們的行業中發揮著至關重要的作用。在使用生成式人工智能時,BBC 將始終考慮藝術家和權利人的權利。
我們將公開透明——信任是 BBC 與觀眾關系的基礎。我們的領導人將始終對 BBC 制作和發布的所有內容和服務向公眾負責。當生成式人工智能輸出出現在我們的內容和服務中時,我們將對受眾保持透明和清晰。人工監督將是發布生成式人工智能內容的一個重要步驟,我們絕不會在我們的產出中完全依賴人工智能生成的研究。
BBC 表示,將與技術公司、其他媒體機構和監管機構合作,安全地開發生成式人工智能,并專注于維護新聞行業的信任。
Davies 在文章中表示:「在接下來的幾個月里,我們將啟動一些項目,探討生成式 AI 在我們制作和工作方式上的應用,采取有針對性的方法,以更好地了解機遇和風險。」「這些項目將評估生成式 AI 如何可能在多個領域支持、補充或甚至轉變 BBC 的活動,包括新聞研究和制作、內容發現和檔案以及個性化體驗。」
該公司沒有具體說明這些項目。其他新聞機構也已經明確了他們對這項技術的看法。美聯社今年早些時候發布了自己的指南。它還與 OpenAI 合作,分享其內容以訓練 GPT 模型。
但在 BBC 確定如何最好地使用生成式人工智能的同時,還阻止了來自 OpenAI 和 Common Crawl 的網絡爬蟲訪問 BBC 網站。
BBC 加入了 CNN、《紐約時報》、路透社和其他新聞機構的行列,防止網絡爬蟲訪問其受版權保護的內容。Davies 表示,這一舉措是為了「維護付費訂閱用戶的利益」,未經 BBC 允許使用 BBC 數據來訓練 AI 模型不符合公眾利益。