降本增效、自由交互的數(shù)字員工,360 智腦大模型應(yīng)用落地實(shí)踐
8月30日,由微新創(chuàng)想主辦的2023AIGC技術(shù)應(yīng)用大會在深圳舉行。本屆大會以“元載萬物·智啟新界”為主題,旨在聚焦AIGC技術(shù)的創(chuàng)新應(yīng)用,打造深入探索AIGC產(chǎn)業(yè)落地的交流平臺。
會上,360集團(tuán)副總裁梁志輝帶來了360智腦大模型應(yīng)用落地實(shí)踐的最新產(chǎn)品和場景,其中精彩觀點(diǎn)如下:
大模型的時代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。
很多企業(yè)希望能夠充分利用大模型的優(yōu)勢:內(nèi)容生成、內(nèi)容理解和邏輯推理。所以我們針對這幾個需求,希望把大模型的能力充分發(fā)揮在企業(yè)最需要的地方。
以下為演講內(nèi)容,由微新創(chuàng)想整理:
01 大模型驅(qū)動的數(shù)字人將顛覆生產(chǎn)關(guān)系
大模型的時代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。
在這過程中我們認(rèn)為大模型它更接近工業(yè)革命,我們相信未來不會只有一個大模型,未來每個公司、每個大企業(yè)都會訓(xùn)練自己的大模型。剛才前面有些嘉賓也提到了,其實(shí)大模型發(fā)展方向是把它做小和做專,我們希望以后能夠把大模型能力賦能到百行千業(yè),中小企業(yè)和大型企業(yè)都能用得上。
在這過程中,企業(yè)場景里去落地大模型會遇到什么問題呢?
一方面,作為一個中國企業(yè),你很難用一個美國的ChatGPT。國內(nèi)雖然也有很多類似的一些產(chǎn)品了。但這類大模型它可能會存在幾個問題:一是數(shù)據(jù)可能會泄漏。二是大模型的幻覺以及知識更新的問題,會讓它在很多企業(yè)內(nèi)部無法使用。第三,如果你去建立一個私有的大模型,其實(shí)很多訓(xùn)練大模型的數(shù)據(jù),它是沒辦法做分級管理的。
很多企業(yè)很難去訓(xùn)練自己的大模型,首先這個資金投入上會很大,并且對很多企業(yè)的員工來說比較費(fèi)時費(fèi)力。一個企業(yè)的IT部門去學(xué)會建自己的大模型、訓(xùn)練一個大模型很貴,會訓(xùn)練大模型的工程師更貴,正常來說一臺A100,價格大概在150萬,但是一個會用A100的工程師至少是兩三百萬年薪起,這是很多企業(yè)很難把大模型落地到自己的內(nèi)部的原因所在。
目前我們正在積極擁抱大模型加Agent方向的一些能力。我們嘗試了很多新的方案,我們的底層不只有一個千億大模型,我們還會有一些百億大模型。其中有些百億大模型專門解決交流對話,有些專門解決文檔分析。我們目前已經(jīng)能夠讓多個大模型協(xié)同工作。在這個大模型之上我們會構(gòu)建一套AI Agent中間件平臺,讓絕大部分的用戶不用直接用大模型,而是通過一些更友好的、角色代入、數(shù)字人的形式去使用,同時讓大模型結(jié)合外部的信息進(jìn)行數(shù)據(jù)學(xué)習(xí)。360本來也是國內(nèi)第二大搜索引擎公司,因此們跟搜索上也做了很多的結(jié)合,讓大模型學(xué)會進(jìn)行一些信息的爬取,讓一些API能夠接入。
具體到落地場的景,我們就是希望能解決兩個問題。第一,對內(nèi)能夠降本增效。第二,能夠提升數(shù)字人交互的自由度。
先說降本增效。這種既有最強(qiáng)大腦又有最佳外表的數(shù)字人能夠7×24小時替你工作。我們可以給很多企業(yè)產(chǎn)出一些這種對外有互動功能的輸出型數(shù)字人,例如數(shù)字名人、數(shù)字客服、數(shù)字銷售、數(shù)字主播等。
在數(shù)字人這一塊,其實(shí)我們今天在很多平臺上也看到了一些數(shù)字人形象的產(chǎn)品,但他不見得是基于真人。目前來說我們也看到小紅書上的一些號,其實(shí)它都已經(jīng)是AI生成的。今天我們希望把這種技術(shù)提升到另外一個階段,我們希望這個人他有最佳的形象,他甚至可以跟你說話,可以做情感陪伴或者甚至可以幫你工作。
在前兩年大家談到的數(shù)字人很多都是這種影視級的數(shù)字人,比如說什么希加加、柳夜熙。但是這樣的數(shù)字人有一個很核心的問題,首先它每一分鐘的內(nèi)容生產(chǎn)成本超過10萬,在這種場景下你只能把它當(dāng)成一個拍電影的方式來進(jìn)行運(yùn)營,絕大部分企業(yè)是用不起來的。
再來說自由交互?,F(xiàn)在很火的能做形象客服的數(shù)字人,也存在一定的問題。我們跟很多這種終端用戶交流后發(fā)現(xiàn),如果今天要做一個直播的話,用這樣的數(shù)字人是很容易被封號的。為什么呢?因?yàn)楹芏嘤^眾看到我跟你交流,你不進(jìn)行回答的話,他會懷疑你這個視頻實(shí)際上是錄播。我們問過同行,就類似于這樣的一些形象克隆數(shù)字人,他被封號的概率超過40%,因?yàn)楹芏嗳似鋵?shí)是能看出來這是個假的。
所以在這種場景,我們希望基于大模型去構(gòu)造的數(shù)字人能夠?qū)崿F(xiàn)跟人之間的自由對話,他每次對話的延遲控制在3秒以內(nèi),目前來說這個我們已經(jīng)做到了。并且,他是可以有記憶、有靈魂的。那為什么叫有記憶呢?實(shí)際上所有人跟它說過的話,今天你告訴他我的女朋友,或者我老婆什么時候出生的、什么時候認(rèn)識的,他可以把這個信息記住,下次再跟你聊的時候他不會像一個全新的操作系統(tǒng)一樣每次都會遺忘。再者他會主動上網(wǎng)學(xué)習(xí)一些最新的資訊,能夠根據(jù)最新的熱搜來幫你編輯一篇小紅書的文案,而不是胡編亂造。
化成具體的角色,今天我們已經(jīng)能夠用大模型生成數(shù)字客服、數(shù)字銷售、數(shù)字主播和數(shù)字名人,后面我們會有一些具體例子可以看到。
像這樣一個“數(shù)字老周”,其實(shí)就是我們做的一個案例。第一次做這個案例的時候是因?yàn)樗柫耍鱿涣四炒未髸髞戆l(fā)現(xiàn)這種方式非常好。為什么呢?因?yàn)檫@樣的視頻其實(shí)我們后來給不同級別的領(lǐng)導(dǎo)都看過,反響非常不錯。只需要一張照片、一段音頻就能復(fù)刻我的形象、我的聲音。只要把演講稿、把他過往寫過的書輸入就能獲得他的這種說話風(fēng)格。
同時我們也可以用這樣的一種形式解決直播帶貨的問題。例如,數(shù)字人可以在直播間里面自動抓取一些問題來自己回答。在這種互動場景中,看直播的用戶不會覺得它是個數(shù)字人,他以為就是一個真人。同時在很多文旅和客服的場景里都需要有一個人親自給你做接待、銷售、介紹,今天有了這套大模型,以及AI Agnet的平臺之后,我們可以讓這樣的一個數(shù)字人更好的帶入自己的角色。它可以看得見、聽得懂、說得好,它能夠克隆你的形象、聲音、動作以及思維,可以非常自然的進(jìn)行人與人之間的交互。
像這樣的數(shù)字人我們其實(shí)是做給安徽省的新華書店的。未來我們可以看到,有可能在書店里有一個無人區(qū),這個區(qū)域所有的圖書推薦都是由這個數(shù)字人來完成。通過這樣的數(shù)字人,以及大家看到的老周的演講,大家已經(jīng)知道它已經(jīng)是一個完成度比較高的產(chǎn)物了。在這個過程里面,實(shí)際上“數(shù)字老周”可以完成PPT的演講,甚至在很多場景中還可以做這種類似于自由的對答。
02 從大模型到數(shù)字員工, 賦能企業(yè)最需要的場景
我們關(guān)注到很多企業(yè)希望能夠充分利用大模型的優(yōu)勢:內(nèi)容生成、內(nèi)容理解和邏輯推理。所以在這個過程里面我們針對這幾個需求,希望把大模型的能力充分發(fā)揮在企業(yè)最需要的地方。
我們希望大模型可以變成員工的知識助手、辦公助手和領(lǐng)導(dǎo)的決策助手。比如說,以往總監(jiān)或者是總經(jīng)理以上一般才有自己的助理,這個高級領(lǐng)導(dǎo)讓底下的助理幫他寫一些文案,做一些內(nèi)容分析,以及去安排一些會議。但是我們會發(fā)現(xiàn)很多企業(yè)里面不只是領(lǐng)導(dǎo)需要這樣的一個數(shù)字員工,其實(shí)每個員工本身也希望有不同的助手能夠幫他去做這些文案的撰寫、行研的分析,以及類似這種多模態(tài)的音視頻創(chuàng)作。
在這個過程里面,實(shí)際上我們做了一個AI數(shù)字員工的平臺,在默認(rèn)的情況下我們已經(jīng)預(yù)訓(xùn)練出來9個AI數(shù)字員工。在這9個AI數(shù)字員工里面有能幫你寫文案的、能幫你做社媒分析的、有能幫你做翻譯的。在這種場景中我們還挖掘了一些新的應(yīng)用出來,也就是說怎么樣讓幾個AI數(shù)字人工能夠幫你去協(xié)同完成一個任務(wù)。我們的產(chǎn)品里面支持企業(yè)知識庫,所以我也許未來一個人開一家公司不是夢想。大家可以利用AI來完成很多執(zhí)行上、協(xié)作上、內(nèi)容分析上的工作。同時我們關(guān)注到,由于大模型的內(nèi)容生成能力非常強(qiáng),所以我們根據(jù)很多企業(yè)的一些應(yīng)用場景,把這種類似于寫工作報(bào)告,寫一些周期性有固定格式的文檔工作交給大模型。
我們就以寫公文為例,以前一個小時最多寫個一千字,但是在我們的AI數(shù)字員工的幫助下一個小時可以寫一萬字。同時我們可以利用我們的360鴻圖的能力來進(jìn)行生圖。過去其實(shí)我們360也有這種大量圖片的需求,因?yàn)槲覀兪且粋€搜索引擎,我們有大量的推廣物料要持續(xù)產(chǎn)出。所以在這種場景中,AI數(shù)字員工率先在360內(nèi)部使用起來。我們每張圖的生產(chǎn)時間大概是2-3分鐘之間,如果要找設(shè)計(jì)師去做這樣的一張圖,他即使用視覺中國的圖修改,一天最多做十張、八張就了不起了?,F(xiàn)在我們一個搜索關(guān)鍵詞對應(yīng)一個配圖,源源不斷地讓AI來生成,一天生成10萬張還是100萬張,其實(shí)取決于我們部署多少算力。
很多企業(yè)內(nèi)部其實(shí)都會有文檔分析的需求,在我們的AI數(shù)字員工里,我們試過把一個非常長的文章讓AI進(jìn)行分析和訓(xùn)練。同樣的一份文檔,如果真人去做閱讀、分析、理解、總結(jié),那可能幾個小時就過去了。但讓AI來做這個事情,200頁的財(cái)報(bào),可能10分鐘它就可以給你提煉,你可以從各種角度來對它進(jìn)一步分析。
對于企業(yè)用戶來說,我們?nèi)绻獙懸粋€文檔,做一個行業(yè)分析,你首先要讓大模型知道你的企業(yè)是干什么的。所以我們提供了一種非常輕量級的,基于知識庫的大模型工具。企業(yè)相關(guān)的知識,很多場景里其實(shí)都是以文檔來呈現(xiàn)的。你可以導(dǎo)入一些網(wǎng)站和數(shù)據(jù),在這種場景中你去建立自己的一個知識庫大模型將會非???、非常輕便。傳統(tǒng)的大模型預(yù)訓(xùn)練大概要花一個月,做微調(diào)也要花大概一周的時間。基于我們企業(yè)級的大模型訓(xùn)練方案,你只要把幾百兆的文檔上傳,那我們的訓(xùn)練時間在一個小時之內(nèi)就能完成。
以上是我們360在企業(yè)實(shí)際業(yè)務(wù)場景中大模型落地的一些案例和經(jīng)驗(yàn),謝謝大家!
更多活動大會一手信息,歡迎加入微新創(chuàng)想會員,現(xiàn)場聆聽一線投資人、頭部企業(yè)家精彩分享,掌握最新創(chuàng)投趨勢!