一小時 12 元,我在北歐監獄里訓練 AI
聲明:本文來自于微信公眾號 InfoQ(ID:infoqchina),作者 | MORGAN MEAKER 譯者 | 張樂 審校 | 平川 策劃 | 凌敏,授權微新創想轉載發布。
芬蘭工資水平普遍較高,并且很少有人從事互聯網行業。外媒 wired 實地走訪發現,一家名為 Metroc 的大模型創業公司發現了一種新型勞動力——囚犯。
芬蘭囚犯的新工作:
幫創業公司訓練大模型
在一個沒有窗戶的房間里,隔著一張消過毒的白色桌子,我被介紹給了一位四十多歲的女性,她有著方形下巴,用一個淡藍色的發帶把金色的頭發扎成了馬尾。她說:“大家都叫我果醬”,讓我也這么稱呼她。
一個星期三的早晨,在這座芬蘭的監獄里,果醬給我們演示了一種新型的監獄勞動形式。
桌子上只有一小塑料瓶水和一臺 HP 筆記本電腦。她們每三小時輪班一次,每小時可以獲得1.54歐元(約合12元人民幣)的報酬。這臺筆記本電腦用來向果醬展示關于房地產的短文,并就她剛剛讀到的內容問她是或否的問題。其中一個問題是:“上面這段話說的是房地產決策而不是申請,對嗎?”
“有點無聊,”果醬聳了聳肩,她也不太清楚這項任務的目的。她認為,"也許她正在幫助創建一個客服聊天機器人"。
事實上,她正在訓練一款由芬蘭創業公司 Metroc 開發的大型語言模型。該公司創建了一個搜索引擎,旨在幫助建筑公司找到新批準的建設項目。為了做到這一點,Metroc 需要標注員幫助其模型理解新聞和市政文件中關于即將開展的建設項目的線索。例如,人工智能必須能夠區分已經委托給建筑師或正在安裝窗戶的醫院項目和可能仍在招人的項目。
在全球范圍內,有數百萬所謂的“網絡工作者”在訓練人工智能模型,教機器區分行人和棕櫚樹,或者描述暴力或性侵害的詞語組合。通常,這類工作人員來自南半球,因為那里的工資比較低。例如,OpenAI 就用了一家外包公司,該公司在肯尼亞、烏干達和印度招聘了網絡工作者。這種安排非常適合美國公司,因為它們使用全球使用最廣泛的語言英語,但在南半球很難找到講芬蘭語的人。
這就是為什么 Metroc 轉向了監獄勞動力。該公司獲得了廉價的、會講芬蘭語的工人,而監獄系統則可以為囚犯提供就業機會,也為他們出獄后進入數字化領域工作做好準備。利用囚犯來訓練人工智似乎有點像科技領域下游經常存在的對廉價勞動力的剝削。但在芬蘭,這個項目得到了廣泛的支持。
“數據勞動力是一個全球性的概念。但如果你仔細觀察一下就會發現,芬蘭的情況截然不同。”來自赫爾辛基大學的研究員圖卡·萊赫蒂尼米(Tuukka Lehtiniemi)說,他一直在研究芬蘭監獄中的數據勞動力。
果醬在哈米納林納監獄已經呆了四個月。這座現代化的建筑有著很大的窗戶。空曠的走廊上,色彩豐富的藝術品正努力營造出愉快的氛圍。要不是因為厚重的灰色安全門擋住了每個進出口,你很容易就會以為,這些房間屬于一所毫無靈魂的大學。
芬蘭監獄的開放性是出了名的,囚犯可以在附近的城鎮工作或學習,但哈米納林納監獄不屬于這一類。相反,哈米納林納監獄是芬蘭安全級別最高的監獄,只收容女性囚犯。果醬被判了六年。根據監獄的隱私規定,wired 不能發布她的真實姓名、確切年齡或其他任何可能讓人識別出她身份的信息。在這個無期徒刑囚犯服刑12年后就可以申請刑滿釋放的國家里,六年是重刑。和其他100名住在這里的囚犯一樣,她也不被允許離開監獄。
當果醬第一次來到監獄的時候,她會看著其他女囚每天早上起床去工作:她們可以自愿做清潔、洗衣或縫紉。每六小時輪班一次,她們可以獲得大約6歐元(約合46.6元人民幣)的報酬。但果醬無法忍受這些工作。“我會覺得非常累,”她說。為此,有很長一段時間,她就呆在牢房里,直到有一位監獄輔導員建議她嘗試“人工智能工作”。三小時一輪班吸引了她,至于報酬,有總比沒有強。“雖然不多,但比呆在牢房里強,”她說。截至目前,她只輪過三次班,但已經獲得了成就感。
這所監獄允許囚犯通過數據工作賺錢。在芬蘭,這樣的監獄只有三所。每所監獄都備有三臺筆記本電腦,供囚犯參與這項人工智能工作時使用。這項工作沒有具體的目標,囚犯按小時取酬,而不是按工作速度或質量。
在哈米納林納監獄,大約有20名囚犯嘗試過這項工作。監獄工作導師米娜·英基寧(Minna Inkinen)留著紅色的短發,她坐在果醬旁邊和我們交談。她說:“有些人確實比其他人更喜歡人工智能工作。”當我在一個星期三的早晨到到達這所監獄時,縫紉室已經忙碌了起來。囚犯們或忙著操作縫紉機,或在織物旁商量事情。但在果醬到達之前,開展人工智能工作的小房間里空無一人。英基寧解釋說:”總共只有三名囚犯自愿定期參加人工智能工作,而另外兩人目前正在上法庭。“果醬補充說:“我更喜歡在一個團隊中做事。”她房間的門一直敞開著,這樣她就可以在回答問題的間隙,與隔壁正在縫紉的獄友聊天。
那些問題是我在監獄以南100公里外的赫爾辛基的一家現代化共享辦公室內手寫的。在那里,我見到了個子高挑、少年感十足的 Metroc 創始人兼首席執行官尤西·維爾納拉(Jussi Virnala)。他帶著我路過一排室內秋千、一張臺球桌和一群西裝革履的男士,來到一個異常悶熱的電話間。他解釋說,這一周真讓人興奮,公司剛剛完成了一輪200萬歐元(約合1554萬元人民幣)的融資,他計劃用這筆錢來擴展北歐市場,投資者對公司與芬蘭監獄的關系很感興趣。他說:“每個人都激動不已,對這種創新方式很感興趣,我認為從產品方面來看,這非常有價值。”
數據標注是個好工作嗎?
將囚犯發展為勞動力的想法是維爾納拉提出的。他們公司需要母語為芬蘭語的人來幫助他們改進其大型語言模型理解建筑行業特有的語言。但在像芬蘭這樣的高薪經濟體中,很難找到這樣的數據勞動力。芬蘭的福利體系可以提供可觀的失業救濟金,這就意味著很少有芬蘭人會主動在類似亞馬遜網絡交易平臺這樣的網絡工作平臺上注冊。“上面沒有多少芬蘭語工作人員,”維爾納拉說,同時他還補充道,“自動翻譯工具仍然不能很好地處理芬蘭語,畢竟以芬蘭語為母語的人總共也才500萬。”
當維爾納拉向芬蘭監獄和青少年教養所的智能監獄項目負責人皮婭·普拉卡(Pia Puolakka)提出他的想法時,她立刻表現出了濃厚的興趣。她說,在人工智能火起來之前,另一家名為 Vainu 的芬蘭科技公司曾經也試過用囚犯做數據勞動力,但其聯合創始人之間的分歧導致項目負責人圖奧馬斯·拉西拉(Tuomas Rasila)離開了公司,Vainu 也就退出了這個項目。
到2022年維爾納拉提出他的提議時,普拉卡非常想恢復人工智能工作。她的工作是設法加強芬蘭監獄與互聯網之間的聯系,使監獄更接近日益數字化的外部世界。到目前為止,監獄的獨立牢房一直都配有筆記本電腦,以便囚犯可以瀏覽有限的網站并申請視頻通話許可。她認為,數據勞動力也是這項任務的一部分。
這項工作的目的不是為了取代傳統的監獄勞動力,比如制作道路標志或園藝工作,它的目標是為囚犯提供更多的工作類型。數據標注員三小時就輪一次班。“如果一天八小時都只做這種工作,可能會讓人覺得很累,”她補充說,如果囚犯可以將數據標注與其他類型的監獄工作并行開展,那就更好了。她說,“這項工作是面向未來的,如果要為囚犯出獄后的生活做準備,那么這些技能至少與監獄提供的傳統工作類型一樣重要”。
然而,數據標注可以為囚犯提供多少可用于出獄后的工作技能還不清楚。作為 Vainu 公司聯合創始人之一的圖奧馬斯·拉西拉(Tuomas Rasila)曾在那里管理了一年的監獄項目,他承認自己沒有這方面的證據。他說,這個項目的運行時間還不足以收集證據,“我認為,讓可能與社會脫節的人去學習現代社會最先進的技術是一個不錯的賦能理念。”
其他人認為,這種新形式的監獄勞動力可能會加劇人工智能革命所帶來的廉價勞動力問題。“我們正朝著一個更便捷高效的全自動化社會發展,但這往往掩蓋了這樣一個事實,即許多系統實際上都是依賴于人的”,來自人權觀察的人工智能高級研究員阿莫斯·陶(Amos Toh)如是說。
在陶看來,對于網絡工作者需求的增加已經引發了一種趨勢,即公司更多地轉向了那些幾乎沒有其他選擇的人群:難民、國家陷入經濟危機的人,現在是囚犯。
“這種情況很常見,”陶說,“我們這里看到的只是一個更廣泛的現象的一部分,即企業正在將技術開發背后的工作外包給可能在剝削性工作條件下勞動的工人。”
對于數據工作是否能幫助囚犯培養數字技能,陶還也是持懷疑態度。“在監獄里,囚犯有很多提升自己的方式,比如考取證書和參加高等教育,”他說,“但我覺得,以每小時一歐元的價格為一家公司標注數據未必能幫他們取得有意義的進步。”哈米納林納監獄確實為囚犯提供了人工智能在線課程,但當工作人員試圖解釋其好處的時候,果醬坐在那里,面無表情。
在我與來自赫爾辛基大學的研究員萊赫蒂尼米見面后,我對于監獄項目的優點有些不那么確定了。從監獄來到 Metroc 的辦公室,監獄里的女性干著每小時1.54歐元的工作,而公司正在慶祝200萬歐元的融資輪,這感覺非常不協調。在赫爾辛基大教堂對面的一家咖啡館里,萊赫蒂尼米耐心地聽我描述了這種感覺。
但對囚犯的采訪讓萊赫蒂尼米有了不同的看法——他對這個項目總的來說是持積極態度的。至于薪酬差距,他認為,這些人是在監獄里,并不是主流社會中的普通勞動力。“將我作為研究員所獲得的報酬與囚犯在監獄里勞動所獲得的報酬進行比較,是沒有意義的,”他說,“我唯一聽到的負面意見是這樣的工作不夠多,只有很少的人可以做。”他提到了每所監獄只有三臺筆記本電腦這個限制。
“當我們提起數據勞動力時,我們往往會想到網絡交易平臺,全球南部或美國農村的人,”他說。但對他來說,這是數據勞工的一個獨特的本地版本,它帶來了有益于社會的轉變。與其他監獄勞動力相比,它為囚犯提供了認知刺激的工作,同時也代表了芬蘭語言在人工智能革命中的地位。
萊赫蒂尼米擔心,如果沒有這種主動性,英語之外的語言將被下一代技術所淘汰,智能音箱仍然難以理解芬蘭語。“并非所有芬蘭人都能說一口流利的英語,所以在當地進行的數據標注還是有必要的,”萊赫蒂尼米說。Metroc 并不是唯一一家被迫尋找芬蘭數據勞動力的公司。2011年,國家圖書館發明了一款游戲,以激勵志愿者幫助他們數字化其歸檔資料。2020年,廣播公司 YLE 與赫爾辛基大學及國家發展公司 VAKE 合作,請求志愿者捐贈他們的芬蘭語錄音。
在某種意義上,芬蘭的監獄項目只是一個開始。有些人擔心,這可能會開創一個先例:在監獄中引入更具爭議的數據標簽類型,比如弱化暴力內容。“即使目前在芬蘭進行的數據標注沒有爭議,我們也必須考慮它所開創的先例,”陶說,“有什么能防止公司將有創傷性和不雅內容的數據標注外包給監獄中的人,尤其是如果他們認為那是一個待開發的勞動力資源?”
芬蘭的監獄以幫助犯人改過自新而聞名,不知道芬蘭監獄里的勞動條件在其他司法沒那么先進的國家是否同樣適用。根據公民權利團體美國公民自由聯盟(ACLU)的數據,76% 的囚犯說監獄勞動是強制性的。拉西拉說,“美國的監獄系統與芬蘭或北歐國家有很大的不同,理念完全不同。在芬蘭,人們會積極推動這個項目,因為每個人都知道這是自愿的。”
人工智能公司需要的數據勞動力只會越來越多,為了跟上發展的步伐,它們就不得不尋找非同尋常的勞動力。隨著 Metroc 規劃擴展到北歐以及芬蘭以外的語言,維爾納拉正在考慮是否將監獄勞動力項目擴展到其他國家,她說“這是我們需要探索的事情”。
原文鏈接:
https://www.wired.com/story/prisoners-training-ai-finland