X / Twitter 更新隱私政策,馬斯克要拿用戶數據訓練 AI了
聲明:本文來自微信公眾號“大數據文摘”(ID:BigDataDigest),作者:文摘菌,授權微新創(chuàng)想轉載發(fā)布。
最近兩天,X(原名Twitter,推特)突然更新了隱私政策,在2.1條例中,X明確寫道:
We may use the information we collect and publicly available information to help train our machine learning or artificial intelligence models for the purposes outlined in this policy.
我們可能會使用收集到的信息和公開可用的信息來幫助訓練我們的機器學習或人工智能模型。
這意味著一旦在X上發(fā)帖創(chuàng)作內容,就意味著同意了馬斯克可以將內容拿去喂AI。
除了這一條可拿用戶數據免費訓練AI 模型的條例外,新版隱私政策還提出:將從9月29日開始收集用戶的生物識別數據、工作和教育信息。如果用戶同意,X會出于安全等目的收集用戶的生物識別信息,讓賬號更加安全。
圖注:馬斯克發(fā)怒,稱要起訴微軟
要知道,在馬斯克前不久還威脅微軟,要起訴它用X的數據訓練AI。更是在ChatGPT剛上線一個月,就違背了收購推特之前簽署的合同,關閉了OpenAI對Twitter“firehose”數據流的訪問權限。
馬斯克現在是X的實際控制人,其積極擁抱AI的做法和他所宣言的AI威脅論顯然格格不入。他曾一度反對AI發(fā)展,也曾在《暫停大型人工智能研究》的公開信上簽字,并不止一次在公開場合宣揚AI威脅論。
但行動上,卻在美國內華達州成立了一家名為X.AI的人工智能(AI)公司,旨在與聊天機器人ChatGPT的開發(fā)公司Open AI展開競爭。
換句話說,盡管視AI為洪水猛獸,馬斯克從未停止過對AI方面的投資、研發(fā)。當下知名的AI公司OpenAI和DeepMind的融資歷程中均有馬斯克的足跡。
馬斯克人工智能公司的獨家 Twitter 數據
圖注:推特隱私條款
X 隱私條款的這一更新最終有利于埃隆·馬斯克今年四月推出的人工智能公司xAI。
雖然xAI主要致力于利用AI研究宇宙的本質,但馬斯克也明確表示,公司將像OpenAI一樣,為普通消費者和企業(yè)推出AI服務。
這其中包括開發(fā)大規(guī)模的AI模型,這類模型對數據的質量和數量有很高的要求,理想情況下,這些數據應該是無版權的。
Twitter有能力生成這種高質量的數據,并可能獨家提供給xAI使用。值得一提的是,Meta公司也通過其社交媒體平臺提供數據,用于訓練自家的AI模型。
自從埃隆·馬斯克接手Twitter后,他一方面致力于防止數據被輕易地從平臺上流出,另一方面也在改善平臺上數據的質量。
比如說,他已經取消了對Twitter API的免費使用權限,轉而推出了多種收費套餐,其價格從每月100美元至5000美元不等,而針對企業(yè)用戶的套餐起價更是高達每月42,000美元。
馬斯克還為那些愿意付費并專門在Twitter平臺上發(fā)布內容的高影響力用戶提供獎勵,這些通常不包括是機器人賬戶。為了獲取更多的曝光度,這些用戶可能會減少引用開放網絡的鏈接或其他來源。
圖注:馬斯克說只拿公開數據訓練
同時,馬斯克也激勵優(yōu)秀的內容創(chuàng)作者,方式是與他們分享由其內容所帶來的廣告收益。比如,他向記者承諾,如果他們直接在Twitter上發(fā)布文章,將會擁有更多的寫作自由和更高的收入。
對此,有外國網友評論:“他真實的意圖是,請在X平臺上發(fā)布獨家內容,為我們的模型訓練提供素材!”
But what he is really saying is, "Come and publish interesting information exclusively on X so that we can use it for our subsidiary companies and train our models on it!".
X/ Twitter還會怎樣做?
X(推特)自身并沒有公開展示AI方面的野心,但其老板埃隆·馬斯克卻有。xAI的公司號稱探尋宇宙的真實本質,而恰好用戶的生物識別數據和其他相關信息適用于支持這一高遠的目標。
xAI的主頁也明確提到,它將與X進行密切合作,共同推進其宏偉任務。
其實,馬斯克還有其他計劃。他近期宣布,將推出一個與LinkedIn競爭的平臺。他形容LinkedIn為“令人尷尬”,而X的版本則會很“酷”。這解釋了為什么X會開始收集用戶的工作和教育信息。此外,一些經認證的組織已經開始在平臺上發(fā)布職位信息,而X也計劃進一步開放這一功能。馬斯克早在5月就暗示過這一點,并隨后收購了一家求職匹配的科技公司Laski。
據悉,這些用戶的數據除了用于推薦職位,收集的這些個人信息也可能用于精準廣告推送。
還有一種可能是X會出售用戶數據以獲取收入。盡管目前沒有明確證據表明這一點,但在社交媒體行業(yè),這算是一種常見的做法。值得注意的是,在過去,Twitter主要是使用收集的用戶數據來提升自身的服務質量,而并沒有將數據用于第三方。
起底X.AI:最強華人天團
人工智能公司x.AI是7月12號成立的。
公司官網顯示,x.AI團隊由馬斯克領導,成員來自DeepMind、OpenAI、Google Research、Microsoft Research、特斯拉以及多倫多大學。
目前官網顯示創(chuàng)始團隊成員目前共有12個人,以及一位顧問 Dan Hendrycks。
這些關鍵團隊成員已經在人工智能研究和開發(fā)的最前沿做出了突出貢獻。例如,Jimmy Ba是多倫多大學的助理教授,曾師從著名的人工智能先驅Geoffrey Hinton,后者在辭職前一直領導著谷歌的人工智能計劃。Christian Szegedy作為谷歌的研究科學家,多年來一直從事人工智能核心項目的研究工作。
而在這12位創(chuàng)始團隊成員中,有5位是華人。Greg Yang(楊格)是 xAI 的聯合創(chuàng)始人,其大學時期的導師是丘成桐教授,之前是微軟研究院的數學家和人工智能研究員。2018年還曾獲得本科生數學領域最高榮譽 Morgan Prize。
Yuhuai(Tony)Wu之前分別在OpenAI 和 DeepMind 都呆過,在多倫多大學完成了博士學位,后在斯坦福大學完成了博士后工作。
張國棟(Guodong Zhang)是一名機器學習和人工智能領域的研究員,之前在微軟亞洲研究院、Google Brain 和 Google DeepMind 都工作過。本科讀的是浙江大學的信息工程專業(yè),碩士和博士都在多倫多大學。本科階段連續(xù)3年在182個人中排名第一,GPA 按照100分算是92.7,按4分算是3.96,曾獲得中國大學生數學建模競賽一等獎。
戴子航(Zihang Dai)工作經歷之前分別在網易投資部、百度深度學習研究院、百度美國以及Google,最近的工作和 Yuhuai(Tony)Wu 一樣,都在 Google 的 RS 團隊。
Jimmy Ba是多倫多大學計算機科學助理教授,2015年發(fā)表神·論文《Adam: A Method for Stochastic Optimization》,其博士畢業(yè)于多倫多大學,師從 Geoffrey Hinton、Brendan Frey 和 Ruslan Salakhutdinov。他的長期研究目標是構建具有類似人類效率和適應性的通用問題解決機器,其研究興趣集中于深度神經網絡的高效學習算法的開發(fā)。
顯然,有最強腦力加持,加上推特天然的數據優(yōu)勢:“推特上有大量多模態(tài)數據,包括對話文本、圖像和不斷增長的長視頻。”xAI 真的能夠打造出 AI 護城河,培育出無與倫比的 AI 競爭優(yōu)勢。
目前,xAI除了和推特合作外,馬斯克稱x.AI將會與特斯拉在芯片方面合作,也許在AI軟件方面也會合作,總之會對特斯拉加快自動駕駛能力的發(fā)展將有互利作用。
參考來源:
https://the-decoder.com/elon-musks-xai-could-train-ai-models-on-your-twitter-data/
https://www.theverge.com/2023/7/12/23792553/elon-musk-xai-artificial-intelligence-company
X/Twitter has updated its Terms of Service to let it use Posts for AI training
https://twitter.com/DrJimFan/status/1679180398134448132
https://mp.weixin.qq.com/s/jJtRMPPvOo7D6Tj5ImtsdQ
https://mp.weixin.qq.com/s/5yKA2XbNDtzauF0L_yvnEw