降本增效、自由交互的數(shù)字員工,360 智腦大模型應(yīng)用落地實(shí)踐
8月30日,由微新創(chuàng)想主辦的2023AIGC技術(shù)應(yīng)用大會(huì)在深圳舉行。本屆大會(huì)以“元載萬(wàn)物·智啟新界”為主題,旨在聚焦AIGC技術(shù)的創(chuàng)新應(yīng)用,打造深入探索AIGC產(chǎn)業(yè)落地的交流平臺(tái)。
會(huì)上,360集團(tuán)副總裁梁志輝帶來了360智腦大模型應(yīng)用落地實(shí)踐的最新產(chǎn)品和場(chǎng)景,其中精彩觀點(diǎn)如下:
大模型的時(shí)代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。
很多企業(yè)希望能夠充分利用大模型的優(yōu)勢(shì):內(nèi)容生成、內(nèi)容理解和邏輯推理。所以我們針對(duì)這幾個(gè)需求,希望把大模型的能力充分發(fā)揮在企業(yè)最需要的地方。
以下為演講內(nèi)容,由微新創(chuàng)想整理:
01 大模型驅(qū)動(dòng)的數(shù)字人將顛覆生產(chǎn)關(guān)系
大模型的時(shí)代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。
在這過程中我們認(rèn)為大模型它更接近工業(yè)革命,我們相信未來不會(huì)只有一個(gè)大模型,未來每個(gè)公司、每個(gè)大企業(yè)都會(huì)訓(xùn)練自己的大模型。剛才前面有些嘉賓也提到了,其實(shí)大模型發(fā)展方向是把它做小和做專,我們希望以后能夠把大模型能力賦能到百行千業(yè),中小企業(yè)和大型企業(yè)都能用得上。
在這過程中,企業(yè)場(chǎng)景里去落地大模型會(huì)遇到什么問題呢?
一方面,作為一個(gè)中國(guó)企業(yè),你很難用一個(gè)美國(guó)的ChatGPT。國(guó)內(nèi)雖然也有很多類似的一些產(chǎn)品了。但這類大模型它可能會(huì)存在幾個(gè)問題:一是數(shù)據(jù)可能會(huì)泄漏。二是大模型的幻覺以及知識(shí)更新的問題,會(huì)讓它在很多企業(yè)內(nèi)部無(wú)法使用。第三,如果你去建立一個(gè)私有的大模型,其實(shí)很多訓(xùn)練大模型的數(shù)據(jù),它是沒辦法做分級(jí)管理的。
很多企業(yè)很難去訓(xùn)練自己的大模型,首先這個(gè)資金投入上會(huì)很大,并且對(duì)很多企業(yè)的員工來說比較費(fèi)時(shí)費(fèi)力。一個(gè)企業(yè)的IT部門去學(xué)會(huì)建自己的大模型、訓(xùn)練一個(gè)大模型很貴,會(huì)訓(xùn)練大模型的工程師更貴,正常來說一臺(tái)A100,價(jià)格大概在150萬(wàn),但是一個(gè)會(huì)用A100的工程師至少是兩三百萬(wàn)年薪起,這是很多企業(yè)很難把大模型落地到自己的內(nèi)部的原因所在。
目前我們正在積極擁抱大模型加Agent方向的一些能力。我們嘗試了很多新的方案,我們的底層不只有一個(gè)千億大模型,我們還會(huì)有一些百億大模型。其中有些百億大模型專門解決交流對(duì)話,有些專門解決文檔分析。我們目前已經(jīng)能夠讓多個(gè)大模型協(xié)同工作。在這個(gè)大模型之上我們會(huì)構(gòu)建一套AI Agent中間件平臺(tái),讓絕大部分的用戶不用直接用大模型,而是通過一些更友好的、角色代入、數(shù)字人的形式去使用,同時(shí)讓大模型結(jié)合外部的信息進(jìn)行數(shù)據(jù)學(xué)習(xí)。360本來也是國(guó)內(nèi)第二大搜索引擎公司,因此們跟搜索上也做了很多的結(jié)合,讓大模型學(xué)會(huì)進(jìn)行一些信息的爬取,讓一些API能夠接入。
具體到落地場(chǎng)的景,我們就是希望能解決兩個(gè)問題。第一,對(duì)內(nèi)能夠降本增效。第二,能夠提升數(shù)字人交互的自由度。
先說降本增效。這種既有最強(qiáng)大腦又有最佳外表的數(shù)字人能夠7×24小時(shí)替你工作。我們可以給很多企業(yè)產(chǎn)出一些這種對(duì)外有互動(dòng)功能的輸出型數(shù)字人,例如數(shù)字名人、數(shù)字客服、數(shù)字銷售、數(shù)字主播等。
在數(shù)字人這一塊,其實(shí)我們今天在很多平臺(tái)上也看到了一些數(shù)字人形象的產(chǎn)品,但他不見得是基于真人。目前來說我們也看到小紅書上的一些號(hào),其實(shí)它都已經(jīng)是AI生成的。今天我們希望把這種技術(shù)提升到另外一個(gè)階段,我們希望這個(gè)人他有最佳的形象,他甚至可以跟你說話,可以做情感陪伴或者甚至可以幫你工作。
在前兩年大家談到的數(shù)字人很多都是這種影視級(jí)的數(shù)字人,比如說什么希加加、柳夜熙。但是這樣的數(shù)字人有一個(gè)很核心的問題,首先它每一分鐘的內(nèi)容生產(chǎn)成本超過10萬(wàn),在這種場(chǎng)景下你只能把它當(dāng)成一個(gè)拍電影的方式來進(jìn)行運(yùn)營(yíng),絕大部分企業(yè)是用不起來的。
再來說自由交互。現(xiàn)在很火的能做形象客服的數(shù)字人,也存在一定的問題。我們跟很多這種終端用戶交流后發(fā)現(xiàn),如果今天要做一個(gè)直播的話,用這樣的數(shù)字人是很容易被封號(hào)的。為什么呢?因?yàn)楹芏嘤^眾看到我跟你交流,你不進(jìn)行回答的話,他會(huì)懷疑你這個(gè)視頻實(shí)際上是錄播。我們問過同行,就類似于這樣的一些形象克隆數(shù)字人,他被封號(hào)的概率超過40%,因?yàn)楹芏嗳似鋵?shí)是能看出來這是個(gè)假的。
所以在這種場(chǎng)景,我們希望基于大模型去構(gòu)造的數(shù)字人能夠?qū)崿F(xiàn)跟人之間的自由對(duì)話,他每次對(duì)話的延遲控制在3秒以內(nèi),目前來說這個(gè)我們已經(jīng)做到了。并且,他是可以有記憶、有靈魂的。那為什么叫有記憶呢?實(shí)際上所有人跟它說過的話,今天你告訴他我的女朋友,或者我老婆什么時(shí)候出生的、什么時(shí)候認(rèn)識(shí)的,他可以把這個(gè)信息記住,下次再跟你聊的時(shí)候他不會(huì)像一個(gè)全新的操作系統(tǒng)一樣每次都會(huì)遺忘。再者他會(huì)主動(dòng)上網(wǎng)學(xué)習(xí)一些最新的資訊,能夠根據(jù)最新的熱搜來幫你編輯一篇小紅書的文案,而不是胡編亂造。
化成具體的角色,今天我們已經(jīng)能夠用大模型生成數(shù)字客服、數(shù)字銷售、數(shù)字主播和數(shù)字名人,后面我們會(huì)有一些具體例子可以看到。
像這樣一個(gè)“數(shù)字老周”,其實(shí)就是我們做的一個(gè)案例。第一次做這個(gè)案例的時(shí)候是因?yàn)樗?yáng)了,出席不了某次大會(huì),后來發(fā)現(xiàn)這種方式非常好。為什么呢?因?yàn)檫@樣的視頻其實(shí)我們后來給不同級(jí)別的領(lǐng)導(dǎo)都看過,反響非常不錯(cuò)。只需要一張照片、一段音頻就能復(fù)刻我的形象、我的聲音。只要把演講稿、把他過往寫過的書輸入就能獲得他的這種說話風(fēng)格。
同時(shí)我們也可以用這樣的一種形式解決直播帶貨的問題。例如,數(shù)字人可以在直播間里面自動(dòng)抓取一些問題來自己回答。在這種互動(dòng)場(chǎng)景中,看直播的用戶不會(huì)覺得它是個(gè)數(shù)字人,他以為就是一個(gè)真人。同時(shí)在很多文旅和客服的場(chǎng)景里都需要有一個(gè)人親自給你做接待、銷售、介紹,今天有了這套大模型,以及AI Agnet的平臺(tái)之后,我們可以讓這樣的一個(gè)數(shù)字人更好的帶入自己的角色。它可以看得見、聽得懂、說得好,它能夠克隆你的形象、聲音、動(dòng)作以及思維,可以非常自然的進(jìn)行人與人之間的交互。
像這樣的數(shù)字人我們其實(shí)是做給安徽省的新華書店的。未來我們可以看到,有可能在書店里有一個(gè)無(wú)人區(qū),這個(gè)區(qū)域所有的圖書推薦都是由這個(gè)數(shù)字人來完成。通過這樣的數(shù)字人,以及大家看到的老周的演講,大家已經(jīng)知道它已經(jīng)是一個(gè)完成度比較高的產(chǎn)物了。在這個(gè)過程里面,實(shí)際上“數(shù)字老周”可以完成PPT的演講,甚至在很多場(chǎng)景中還可以做這種類似于自由的對(duì)答。
02 從大模型到數(shù)字員工, 賦能企業(yè)最需要的場(chǎng)景
我們關(guān)注到很多企業(yè)希望能夠充分利用大模型的優(yōu)勢(shì):內(nèi)容生成、內(nèi)容理解和邏輯推理。所以在這個(gè)過程里面我們針對(duì)這幾個(gè)需求,希望把大模型的能力充分發(fā)揮在企業(yè)最需要的地方。
我們希望大模型可以變成員工的知識(shí)助手、辦公助手和領(lǐng)導(dǎo)的決策助手。比如說,以往總監(jiān)或者是總經(jīng)理以上一般才有自己的助理,這個(gè)高級(jí)領(lǐng)導(dǎo)讓底下的助理幫他寫一些文案,做一些內(nèi)容分析,以及去安排一些會(huì)議。但是我們會(huì)發(fā)現(xiàn)很多企業(yè)里面不只是領(lǐng)導(dǎo)需要這樣的一個(gè)數(shù)字員工,其實(shí)每個(gè)員工本身也希望有不同的助手能夠幫他去做這些文案的撰寫、行研的分析,以及類似這種多模態(tài)的音視頻創(chuàng)作。
在這個(gè)過程里面,實(shí)際上我們做了一個(gè)AI數(shù)字員工的平臺(tái),在默認(rèn)的情況下我們已經(jīng)預(yù)訓(xùn)練出來9個(gè)AI數(shù)字員工。在這9個(gè)AI數(shù)字員工里面有能幫你寫文案的、能幫你做社媒分析的、有能幫你做翻譯的。在這種場(chǎng)景中我們還挖掘了一些新的應(yīng)用出來,也就是說怎么樣讓幾個(gè)AI數(shù)字人工能夠幫你去協(xié)同完成一個(gè)任務(wù)。我們的產(chǎn)品里面支持企業(yè)知識(shí)庫(kù),所以我也許未來一個(gè)人開一家公司不是夢(mèng)想。大家可以利用AI來完成很多執(zhí)行上、協(xié)作上、內(nèi)容分析上的工作。同時(shí)我們關(guān)注到,由于大模型的內(nèi)容生成能力非常強(qiáng),所以我們根據(jù)很多企業(yè)的一些應(yīng)用場(chǎng)景,把這種類似于寫工作報(bào)告,寫一些周期性有固定格式的文檔工作交給大模型。
我們就以寫公文為例,以前一個(gè)小時(shí)最多寫個(gè)一千字,但是在我們的AI數(shù)字員工的幫助下一個(gè)小時(shí)可以寫一萬(wàn)字。同時(shí)我們可以利用我們的360鴻圖的能力來進(jìn)行生圖。過去其實(shí)我們360也有這種大量圖片的需求,因?yàn)槲覀兪且粋€(gè)搜索引擎,我們有大量的推廣物料要持續(xù)產(chǎn)出。所以在這種場(chǎng)景中,AI數(shù)字員工率先在360內(nèi)部使用起來。我們每張圖的生產(chǎn)時(shí)間大概是2-3分鐘之間,如果要找設(shè)計(jì)師去做這樣的一張圖,他即使用視覺中國(guó)的圖修改,一天最多做十張、八張就了不起了。現(xiàn)在我們一個(gè)搜索關(guān)鍵詞對(duì)應(yīng)一個(gè)配圖,源源不斷地讓AI來生成,一天生成10萬(wàn)張還是100萬(wàn)張,其實(shí)取決于我們部署多少算力。
很多企業(yè)內(nèi)部其實(shí)都會(huì)有文檔分析的需求,在我們的AI數(shù)字員工里,我們?cè)囘^把一個(gè)非常長(zhǎng)的文章讓AI進(jìn)行分析和訓(xùn)練。同樣的一份文檔,如果真人去做閱讀、分析、理解、總結(jié),那可能幾個(gè)小時(shí)就過去了。但讓AI來做這個(gè)事情,200頁(yè)的財(cái)報(bào),可能10分鐘它就可以給你提煉,你可以從各種角度來對(duì)它進(jìn)一步分析。
對(duì)于企業(yè)用戶來說,我們?nèi)绻獙懸粋€(gè)文檔,做一個(gè)行業(yè)分析,你首先要讓大模型知道你的企業(yè)是干什么的。所以我們提供了一種非常輕量級(jí)的,基于知識(shí)庫(kù)的大模型工具。企業(yè)相關(guān)的知識(shí),很多場(chǎng)景里其實(shí)都是以文檔來呈現(xiàn)的。你可以導(dǎo)入一些網(wǎng)站和數(shù)據(jù),在這種場(chǎng)景中你去建立自己的一個(gè)知識(shí)庫(kù)大模型將會(huì)非常快、非常輕便。傳統(tǒng)的大模型預(yù)訓(xùn)練大概要花一個(gè)月,做微調(diào)也要花大概一周的時(shí)間。基于我們企業(yè)級(jí)的大模型訓(xùn)練方案,你只要把幾百兆的文檔上傳,那我們的訓(xùn)練時(shí)間在一個(gè)小時(shí)之內(nèi)就能完成。
以上是我們360在企業(yè)實(shí)際業(yè)務(wù)場(chǎng)景中大模型落地的一些案例和經(jīng)驗(yàn),謝謝大家!
更多活動(dòng)大會(huì)一手信息,歡迎加入微新創(chuàng)想會(huì)員,現(xiàn)場(chǎng)聆聽一線投資人、頭部企業(yè)家精彩分享,掌握最新創(chuàng)投趨勢(shì)!