對(duì)話稚暉君:具身智能創(chuàng)業(yè)窗口轉(zhuǎn)瞬即逝,打擂瞄準(zhǔn)偶像馬斯克
編者按:本文來(lái)自微信公眾號(hào) “量子位”(ID:QbitAI),作者:衡宇,微新創(chuàng)想經(jīng)授權(quán)轉(zhuǎn)載。
說(shuō)出這話的稚暉君,十分清楚他離開(kāi)華為創(chuàng)業(yè)要做什么:
對(duì)標(biāo)馬斯克,做通用機(jī)器人,競(jìng)品擎天柱,既面向星辰大海也奔著商用落地,產(chǎn)品目標(biāo)最終定價(jià)不超過(guò)20萬(wàn)人民幣。
換成最流行的說(shuō)法,他在做大模型和機(jī)器人結(jié)合的具身智能。
想法始于他學(xué)生時(shí)期的探索。
早在他還沒(méi)成B站up主的2015年,學(xué)生身份的稚暉君就參與組織了一群打比賽認(rèn)識(shí)的小伙伴,準(zhǔn)備“做個(gè)人吧”:
當(dāng)時(shí),普通人對(duì)AI的切身感受還是人臉識(shí)別或美顏這類應(yīng)用,大模型概念還沒(méi)誕生,“要讓機(jī)器人具備像人一樣的思考和行動(dòng)能力”這個(gè)命題,似乎離實(shí)現(xiàn)還有點(diǎn)過(guò)于遙不可及。
因此,畢業(yè)后的稚暉君沒(méi)繼續(xù)只在機(jī)器人身上折騰,而是選擇進(jìn)入AI賽道,成為大廠的AI算法工程師,在軟件算法領(lǐng)域干了好幾年。
直到ChatGPT石破天驚,大模型智能涌現(xiàn),OpenAI證明大力堆疊真的可以產(chǎn)生質(zhì)變。
回看自己的機(jī)器人夢(mèng)想,稚暉君又看到了這條路的可行性。
所以,離開(kāi)菊廠,投身創(chuàng)業(yè)。
于是半年時(shí)間,他帶著團(tuán)隊(duì)拿出了一套有模有樣的原型機(jī)。
8月發(fā)布會(huì)上,被稚暉君自豪請(qǐng)上臺(tái)的自家機(jī)器人步伐穩(wěn)健,行走效果可以比肩去年馬斯克擎天柱Optimus的初亮相。
就是憑借這樣一款作品,他的初創(chuàng)公司智元機(jī)器人,在投資者冷靜但賽道又火爆的當(dāng)下,成為了少數(shù)幾個(gè)拿到VC和大廠戰(zhàn)投重金押注的標(biāo)的。
發(fā)布會(huì)結(jié)束后和量子位的會(huì)面,他表露出對(duì)發(fā)布會(huì)、團(tuán)隊(duì)和整體進(jìn)展的還算滿意,也表露出沿著這條路往未來(lái)走的信心。
還在他的工位前告訴我們,他的桌面壁紙已經(jīng)換了很久了:
全身心投入人形機(jī)器人創(chuàng)業(yè),他會(huì)怎么看待自己公司的高估值?智元的下一步規(guī)劃是什么?商業(yè)化落地場(chǎng)景將在何方?創(chuàng)業(yè)過(guò)后這個(gè)百大up主的B站賬號(hào)咋辦?
量子位問(wèn),稚暉君答,一切都在這次對(duì)話中。
再晚點(diǎn),也許就不用出來(lái)創(chuàng)業(yè)了
稚暉君算是最早感知到這一波大環(huán)境變化,并且付諸實(shí)踐的那撥人。
外界看來(lái),他去年年底宣布創(chuàng)業(yè)時(shí),機(jī)器人和大模型都是科技領(lǐng)域的大熱議題,尤其是ChatGPT剛出道,帶給大家暴力美學(xué)的震撼。
那個(gè)時(shí)間節(jié)點(diǎn),賽道遠(yuǎn)沒(méi)有今天擁擠。技術(shù)從業(yè)者聞風(fēng)而動(dòng),不算意外。
但稚暉君第一次透露了他當(dāng)時(shí)的心態(tài):
要是選擇再晚一點(diǎn),也許就沒(méi)必要出來(lái)創(chuàng)業(yè)做這事了。
為了解釋這句話,他給競(jìng)品特斯拉擎天柱拉出一條時(shí)間線:
去年9月展示原型機(jī),今年5月展示識(shí)別周圍環(huán)境存儲(chǔ)記憶和準(zhǔn)確控制物品拿放的能力,7月表示已經(jīng)生產(chǎn)10臺(tái),預(yù)計(jì)11月進(jìn)行行走測(cè)試,明年在特斯拉自己的工廠進(jìn)行實(shí)用性測(cè)試。
動(dòng)作很快,實(shí)際效果也哇噻。
馬斯克,一個(gè)從不按套路出牌的男人,自從宣布入局機(jī)器人賽道,就用火箭般的速度推進(jìn)量產(chǎn)節(jié)奏,在他的口中,未來(lái)機(jī)器人的數(shù)量會(huì)超過(guò)人類。
稚暉君看到這一切,心潮澎湃。
與此同時(shí),他也觀察到機(jī)器人和大模型結(jié)合的潛力。
微軟的ChatGPT for Robotics,谷歌的Palm-E、RT-1、RT-2,還有VoxPoser、RoboCat等眾多工作,都在嘗試把圖像語(yǔ)言大模型的能力和知識(shí)遷移到機(jī)器人領(lǐng)域。
其中轟動(dòng)最大的谷歌RT(Robot Transformer)系列,在論文闡述和demo視頻中,都展示出抓取領(lǐng)域非常優(yōu)秀的泛化能力。
要做到這一點(diǎn)并不容易,核心門檻,在于數(shù)據(jù)。
光是訓(xùn)練它,谷歌就花了17個(gè)月,收集13臺(tái)機(jī)器人的13萬(wàn)條機(jī)器人真實(shí)數(shù)據(jù)——這大概也是RT模型開(kāi)源而數(shù)據(jù)暫時(shí)閉源的一個(gè)小小心機(jī)。
稚暉君坦言,雖然也從一開(kāi)始就在準(zhǔn)備自家的動(dòng)作任務(wù)數(shù)據(jù)集,但目前能用來(lái)訓(xùn)練自家產(chǎn)品的數(shù)據(jù),“只有上千”。
一對(duì)比,差距之大,顯而易見(jiàn)。
數(shù)字上的直觀差距,足以解釋稚暉君對(duì)量子位說(shuō)的,“當(dāng)前節(jié)點(diǎn),遠(yuǎn)征A1最需要提升的地方,是數(shù)據(jù)帶來(lái)的AI泛化能力”,足以解釋這為什么“會(huì)是一個(gè)相對(duì)長(zhǎng)期的布局”。
也能部分解釋發(fā)布機(jī)器人時(shí),直播間網(wǎng)友對(duì)展示時(shí)間較短、展示能力不如想象炫酷的疑問(wèn)。
“我覺(jué)得要想達(dá)到真正理想的實(shí)用效果,還是需要大量的真實(shí)場(chǎng)景數(shù)據(jù)。我們時(shí)間太短了,這方面還沒(méi)有做夠積累。”稚暉君如是說(shuō)。
競(jìng)爭(zhēng)對(duì)手不會(huì)給你多留喘息的機(jī)會(huì)。正因如此,稚暉君表示團(tuán)隊(duì)接下來(lái)的工作重心之一,是建立自己的數(shù)據(jù)中心。
計(jì)劃未來(lái)幾個(gè)月內(nèi)落地臨港,主要目的是搭建場(chǎng)景和仿真平臺(tái),填補(bǔ)運(yùn)動(dòng)數(shù)據(jù),提高泛化能力。
數(shù)據(jù)是如何生成的?稚暉君的總結(jié)有三:
-
監(jiān)督學(xué)習(xí)數(shù)據(jù)。靠人做示范,控制機(jī)器人做分揀等各種操作,在過(guò)程中采集真實(shí)數(shù)據(jù)。
-
仿真數(shù)據(jù)。需要自己搭建仿真平臺(tái),有一個(gè)比較好的渲染引擎、物理引擎,以及比較好的人機(jī)交互流程裝置。
-
AIGC生成數(shù)據(jù)。主要是真實(shí)數(shù)據(jù)的補(bǔ)充擴(kuò)充,是低成本數(shù)據(jù)增強(qiáng)的一個(gè)重要手段。
建數(shù)據(jù)中心是工作重點(diǎn)之一,另一個(gè)重點(diǎn)則是對(duì)硬件結(jié)構(gòu)進(jìn)行迭代重構(gòu),加強(qiáng)機(jī)器人本體運(yùn)動(dòng)性能。
按稚暉君的說(shuō)法,團(tuán)隊(duì)會(huì)用做軟件敏捷開(kāi)發(fā)的速度和效率去迭代硬件。
這是非常顛覆并且有挑戰(zhàn)性的一件事情。
此處送上小八卦一則。
今年4月,智慧軍在投稿B站的自制雙足機(jī)器人哪吒,并在視頻結(jié)尾表示,“如果不出意外的話,哪吒會(huì)成為發(fā)布會(huì)的彩蛋”。
當(dāng)然了,按照經(jīng)典劇情,不出意外的話果然就出意外了:D,哪吒并沒(méi)有上發(fā)布會(huì)。
就是它 ↓
量子位幫大家打聽(tīng)到,原因是哪吒上面用到的幾個(gè)電機(jī)被供應(yīng)商鴿了,3月下的訂單7月才收到貨,導(dǎo)致開(kāi)發(fā)時(shí)間不夠。
稚暉君說(shuō)道:“后面有空還是會(huì)繼續(xù)完成這個(gè)項(xiàng)目的,鴿王有坑必填。”
半年成獨(dú)角獸,背后還有另一條商業(yè)化隱線
讀到這里大概能察覺(jué),智元人形機(jī)器人項(xiàng)目的機(jī)器人本體,還需要迭代幾版;而AI能力受限于當(dāng)前訓(xùn)練數(shù)據(jù)不足,也還需要積累一段時(shí)間。
總體來(lái)說(shuō),產(chǎn)品離落地似乎還有一段距離的樣子。
然而就是這樣一個(gè)創(chuàng)業(yè)項(xiàng)目,半年估值直奔10億美元開(kāi)外。
這合理嗎???
聽(tīng)到這個(gè)問(wèn)題,稚暉君并沒(méi)有直接回答到底“值或不值”,只是回答道,其實(shí)融資思路也不是一開(kāi)始就定型的,期間參考了很多行業(yè)大佬和前輩的建議。
團(tuán)隊(duì)最初的設(shè)想很單純,就是先做出Demo,然后順其自然地提高估值。
“但創(chuàng)業(yè)顯然不是那么單純的事情,大經(jīng)濟(jì)環(huán)境不算景氣的背景下,要整合資源、吸引人才,無(wú)一不需資本的背書。”稚暉君表示,“這并不是一件壞事。”
高效實(shí)干,快速調(diào)整思路和策略,以結(jié)果導(dǎo)向推進(jìn)事情,這是稚暉君的行事風(fēng)格。
他的風(fēng)格最終也決定了智元,至少是智元研發(fā)團(tuán)隊(duì)的工作風(fēng)格。
技術(shù)團(tuán)隊(duì)每個(gè)早期成員都是他親自面進(jìn)公司的,30多號(hào)人基本都是自來(lái)卷,卷得一天睡五、六個(gè)小時(shí)的稚暉君都心生感慨:
之前大家都覺(jué)得我是時(shí)間管理大師,現(xiàn)在我可以很慚愧地講,我們公司像我這么肝的,還有一堆……
整個(gè)交流過(guò)程中,量子位關(guān)注到他強(qiáng)調(diào)了兩個(gè)關(guān)鍵詞,“壓成本”和“應(yīng)用場(chǎng)景”。
這倆是目前整個(gè)賽道的普遍痛點(diǎn)。團(tuán)隊(duì)如何解決痛點(diǎn),必然是他們獲得高瓴、鼎暉、經(jīng)緯、高榕、藍(lán)馳、BV百度風(fēng)投等頭部資方重金押注的關(guān)鍵。
來(lái)聽(tīng)聽(tīng)稚暉君的看法——
先說(shuō)壓低成本。
現(xiàn)在智元對(duì)外喊出的口號(hào)是,人形機(jī)器人落地控價(jià)20萬(wàn)元內(nèi)。
這約與馬斯克放話的7萬(wàn)美元售價(jià)持平,而國(guó)內(nèi)類似人形機(jī)器人的售價(jià)水平在50萬(wàn)RMB上下,大家喜聞樂(lè)見(jiàn)的波士頓動(dòng)力Atlas,成本則在200萬(wàn)美元。
稚暉君直言不諱:“不是我們希望做到20萬(wàn)元,而是如果做不到20萬(wàn)元的價(jià)格,就根本沒(méi)辦法實(shí)現(xiàn)商業(yè)落地。”
至于為什么是20萬(wàn),他表示,以新能源汽車制造業(yè)為例,20萬(wàn)的機(jī)器人替代部分人工崗位的話,可以做到1~2年的投資回報(bào)期。
稚暉君也大致描述了一下智元為量產(chǎn)控制成本的方法。
一是盡最大可能采取自研路線,降本增效。
如關(guān)節(jié)電機(jī)和靈巧手等部件占硬件成本一半以上,而且市場(chǎng)現(xiàn)有供應(yīng)還存在特性不匹配的情況,自主研發(fā)核心部件能讓成本降低一半以上。
二是采用類似特斯拉造車的部分思路,用軟件和算法補(bǔ)硬件方面的精度要求,降低硬件成本。
如放棄諧波減速器而選擇行星減速器,靈巧手上面使用的視覺(jué)閉環(huán)方案等等。
再說(shuō)落地應(yīng)用場(chǎng)景。
稚暉君表示,預(yù)計(jì)明年下半年商業(yè)化落地,先應(yīng)用在工業(yè)制造領(lǐng)域,家庭等服務(wù)型應(yīng)用場(chǎng)景都往后排,現(xiàn)階段突出一個(gè)“場(chǎng)景相對(duì)簡(jiǎn)單,任務(wù)相對(duì)復(fù)雜”。
“這條路線是邊走邊摸索出來(lái)的,還是最初就定下的目標(biāo)?”
“團(tuán)隊(duì)還不到10個(gè)人時(shí)候的最早期,我們就基本敲定了這條落地方案。”
同時(shí)表示,
很多人會(huì)拿我們或者特斯拉的機(jī)器人去跟波士頓動(dòng)力對(duì)比,其實(shí)是不合適的。
奔著商業(yè)化落地去做,正確的邏輯應(yīng)該是:在滿足應(yīng)用場(chǎng)景功能和性能需求的前提下,以盡量最低的成本去實(shí)現(xiàn)方案。所以能走著去搬東西的場(chǎng)景下,就沒(méi)有必要非得讓它有能力后空翻。
現(xiàn)在,這條半年前定下的路線,最終落地跡象愈發(fā)明晰。
最新工商動(dòng)態(tài)顯示,比亞迪入股了智元下屬公司,加上此前量子位從智元方面獲悉,公司已與國(guó)產(chǎn)頭部智能汽車廠商和3C廠商等密切洽談。
由此在官宣前推測(cè)一波,遠(yuǎn)征A1在工業(yè)制造領(lǐng)域的首發(fā)打工地點(diǎn),不出意外,就是比亞迪汽車工廠。
除成本和落地場(chǎng)景這兩點(diǎn)外,隨著團(tuán)隊(duì)對(duì)具身智能的愈發(fā)深入,智元手里還握了些其它差異化的牌。
比如,量子位就從稚暉君口中挖到公司商業(yè)化的一條隱線——
如果說(shuō)通用人形機(jī)器人是商業(yè)落地的中長(zhǎng)期計(jì)劃和最終愿景,那么在邁向這個(gè)終點(diǎn)的過(guò)程中,團(tuán)隊(duì)也會(huì)有一些“沿途下蛋”的產(chǎn)品形態(tài)。
具體是什么形態(tài)呢?稚暉君一如既往地口風(fēng)很嚴(yán),賣了個(gè)關(guān)子,但還是有所透露。
他聽(tīng)到過(guò)很多次疑問(wèn),問(wèn)為什么要把機(jī)器人做成人類形態(tài),相比于其他專用形態(tài)(機(jī)械臂、輪式),是不是費(fèi)力不討好?
針對(duì)這個(gè)問(wèn)題,稚暉君有兩方面思考。
一方面,這會(huì)是一個(gè)長(zhǎng)期投入的過(guò)程,大家不要高估短期的價(jià)值,也不要低估長(zhǎng)期的價(jià)值。
人形是智元以終為始、面向終極形態(tài)邁出的第一步,這也是為什么給這款機(jī)器人取名叫“遠(yuǎn)征”。
另一方面,選擇做這件事情(人形)并不是因?yàn)樗菀祝炊且驗(yàn)樗芾щy。
通用人形機(jī)器人牽涉到最全面的機(jī)器人技術(shù)棧,它的實(shí)現(xiàn)過(guò)程中各種前沿技術(shù)(視覺(jué)伺服、MPC、SLAM、LLM/VLM、中間件等各種技術(shù)的自研和優(yōu)化)的沿途下蛋,可以催生很多創(chuàng)新性專用形態(tài)的機(jī)器人產(chǎn)品,“大家未來(lái)會(huì)陸續(xù)看到這些成果的”。
“網(wǎng)友們放心,B站賬號(hào)不會(huì)變成公司專用營(yíng)銷號(hào)”
過(guò)人的技術(shù),漂亮的簡(jiǎn)歷,大廠的光環(huán),百萬(wàn)計(jì)的粉絲,又恰逢新技術(shù)爆發(fā)周期:大模型、具身智能、AIGC……攢局創(chuàng)業(yè)后,出任團(tuán)隊(duì)CTO,帶領(lǐng)公司迅速壯大,半年時(shí)間,公司人數(shù)近百,市場(chǎng)估值超10億美元。
一系列附帶光環(huán)的故事砸過(guò)來(lái),圍觀者不由得在這個(gè)時(shí)候,重新審視稚暉君。
他又會(huì)怎樣定義現(xiàn)在的自己?量子位把這個(gè)問(wèn)題拋給了稚暉君本人。
稚暉君倒沒(méi)表現(xiàn)出什么遲疑,只是說(shuō),他給自己的定位并沒(méi)有太大變化。
首先是個(gè)工程師,其次才是創(chuàng)業(yè)者。
我可能屬于一個(gè)非典型創(chuàng)業(yè)者,做這些事情的動(dòng)力都是基于個(gè)人興趣,也很幸運(yùn)取得了一些小成就:早期在大廠里發(fā)光發(fā)熱,頂了一些光環(huán),又在網(wǎng)上獲得了不小的知名度,然后又突然跑出來(lái)創(chuàng)業(yè)。一開(kāi)始身邊的人都覺(jué)得挺震驚的。
我一直認(rèn)為自己是一個(gè)樂(lè)觀主義者。
還有句話,他說(shuō)得毫不猶豫——
“既然人生沒(méi)有后悔的機(jī)會(huì),那么就堅(jiān)持相信自己到現(xiàn)在的每一步,都是我做的最正確的選擇。”
“每一步都是正確的選擇”,可能也包括不少人為之唏噓的離開(kāi)華為,脫離“天才”tag。
在量子位面前,他沒(méi)有掩飾曾經(jīng)在華為工作取得榮譽(yù)的感激,也提到,
老東家在做一些很偉大的事情,但是像機(jī)器人這樣面向更未來(lái)領(lǐng)域的探索,可能更適合在小的創(chuàng)新團(tuán)隊(duì)中去做。
希望自己能繼承‘散是滿天星’的優(yōu)良傳統(tǒng)吧“。
然后,又像他常常做的那樣,再次強(qiáng)調(diào)自己既不是天才,也不再是少年。
能感受到,稚暉君更希望外界把對(duì)他的關(guān)注從一個(gè)具體的tag,轉(zhuǎn)移到他想做的事情本身。
有趣的是,他又勸大伙兒不要太早創(chuàng)業(yè)。“對(duì)于學(xué)生來(lái)說(shuō),建議還是要先工作幾年,接受一下社會(huì)的毒打,才對(duì)社會(huì)、公司運(yùn)作的方式有一個(gè)清晰的了解哈哈。”
當(dāng)時(shí)在發(fā)布會(huì)上,他也表達(dá)了自己的觀點(diǎn):檢驗(yàn)一家科技公司價(jià)值最有效的方式之一,就看它能否實(shí)現(xiàn)商用落地。
不然技術(shù)做得再好也容易陷入自嗨。
聊到這兒,稚暉君表露心跡,既然正兒八經(jīng)創(chuàng)業(yè)了,項(xiàng)目也不能單純按照個(gè)人的奇思妙想隨意自嗨了。
組了人、拿了錢,就需要在公司戰(zhàn)略發(fā)展方向上多做考慮,“要為公司這么多兄弟姐妹們負(fù)責(zé)”。
但顯然,他自有自嗨處:B站。
“個(gè)人號(hào)啊?這陣子太忙了(所以沒(méi)更新)。”稚暉君解釋到,稱自己絕對(duì)沒(méi)有挖坑就跑的意思,“后面稍微閑下來(lái)一點(diǎn),還是會(huì)更新的。”
至于之后的B站投稿,還會(huì)是原來(lái)的風(fēng)格,原來(lái)的味道,可能偶爾夾雜一些創(chuàng)業(yè)日常。
但他保證,不會(huì)變成純粹公司的營(yíng)銷窗口。
(他暗示,畢竟智元有單獨(dú)的官方賬號(hào),歡迎大家關(guān)注~)
“也是向馬斯克學(xué)習(xí)嘛,他在公司管理運(yùn)營(yíng)和個(gè)人賬號(hào)運(yùn)作之間,就做得很好。”
本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表微新創(chuàng)想立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系http://www.i0562.net/。