00后華人大模型創(chuàng)業(yè),硅谷頂級投資人搶投
編者按:本文來自微信公眾號 融中財經(ID:thecapital),作者: 張淼,編輯:吾人,微新創(chuàng)想經授權轉載。
近日,AI初創(chuàng)公司Kinesys AI被曝拿到了Zoom系、Getty家族和快手系的天使投資。據(jù)悉,這家公司的創(chuàng)始人是一位00后華人小伙,團隊成員也只有7個人,但他們卻開發(fā)了目前AI開發(fā)者們最需要的大模型中間件Cortex,這也是他們獲得資本青睞的原因。
在AI競賽的大背景下,一些創(chuàng)業(yè)公司去類似ChatGPT的大模型開發(fā),顯得力不從心,無論是從資金還是技術上,都比不過那些據(jù)圖企業(yè)。但這些創(chuàng)業(yè)公司去做一些AI競賽中還少有人做的“小而美”的項目,可能會收到意想不到的效果。
01Cortex改變了什么?
讓Kinesys AI成功逆襲的大模型中間件Cortex,目前在國外已經火了起來。
首先我們來看Cortex為何這樣受歡迎?
Cortex也被稱為大模型的中間件。什么是大模型中間件?比較官方的定義是,大模型中間件是在底層大模型和上層應用之間的中間層基礎軟件,主要用以解決大模型落地過程中,集成數(shù)據(jù)、應用、知識庫,以及大模型融合級功能協(xié)同這些問題。
Cortex的技術底層邏輯是這樣的,它對于底層大模型的作用是提供了包括 GPT-4 在內的諸多大模型 API、數(shù)據(jù)接口等,讓AI應用的開發(fā)者門可以根據(jù)需要直接調用,實現(xiàn)大語言模型的協(xié)同應用,不再像以前那樣從頭搭建環(huán)境,然后再逐個置入需要的API,最后還得反復進行測試。Cortex節(jié)省了AI開發(fā)者大量的人力和時間成本。
與此同時,Cortex還向用戶提供了一些第三方數(shù)據(jù)的API接口,可以外接私有數(shù)據(jù),做一些特定領域的私有版GPT。目前已經支持的第三方數(shù)據(jù)包括Notion、Slack、Google Drive等。值得一提的是,Cortex提供諸多領域的大模型應用,不局限在個別領域。
另外,Cortex在應用層的作用是幫助AI應用的開發(fā)者營銷,用戶可以直接使用發(fā)布在 Cortex 上的應用,并且可以在原有基礎上調整參數(shù),進行個性化的二次開發(fā)。
Cortex還有一個私人copilot功能,比如制作PPT、撰寫草稿、編寫電郵、總結會議等等這些基礎工作,Cortex都能輕松應對。
其實Cortex最大的優(yōu)勢就是將之前AI開發(fā)者二三個月才能完成的工作縮短到了幾分鐘,以前AI開發(fā)者要一項一項的完成的任務,Cortex都給你打包搞定了。
目前已經有十幾家付費企業(yè)用戶和上千個個人用戶,市場前景十分廣闊,因此能得到硅谷投資人的青睞并不意外。
根據(jù)公開資料顯示,Kinesys AI公司目前只有7人全職,2名創(chuàng)始人均為華人,其中創(chuàng)始人兼CEO,Nemo Yang是00后,求學之路比較傳奇,只花了兩年時間就拿下了佐治亞理工學院本碩學位。另外他之前在字節(jié)跳動、飛書和微軟這些超級大廠工作過。
據(jù)悉,中學時代的Nemo Yang就超級喜歡計算機,后來自己一個人來到硅谷留學。
另外一位創(chuàng)始人兼CTO,名叫Jian Cai,也是華人,并且其還是畢業(yè)于北京大學計算機系的學霸,曾在谷歌工作過8年,有著豐富的互聯(lián)網(wǎng)工作經驗。
除了中國外,還有員工來自美國,印度,韓國等國家,并且多人與Nemo Yang是斯坦福校友。
02資本青睞“大模型中間件”
除了Kinesys AI,還有一些大模型中間件創(chuàng)業(yè)企業(yè)獲得融資。
自從2022年底ChatGPT大火之后,全球掀起了AI競賽,AI相關創(chuàng)業(yè)如潮水般洶涌,就大模型中間件來說,同樣是一眾創(chuàng)業(yè)者涌來。
如果更簡單的理解大模型中間件作用的話,那就是由于ChatGPT作為底層基礎模型,可以直接為普通用戶提供具備一定專業(yè)水平的內容,但與專業(yè)用戶的需求仍有差距,于是為大模型中間件帶來了的市場機會。同時,這些開發(fā)大模型中間件的創(chuàng)業(yè)企業(yè)也被資本看中,接連獲得融資。
ChatGPT發(fā)布之后,短短幾個月內就出現(xiàn)了許多大模型中間件項目。
由LangChain Inc公司開發(fā)的LangChain,與Cortex有些相似。相關資料顯示,LangChain是一個大語言模型應用開發(fā)庫,希望將各種大語言模型整合起來,結合其他知識來源或計算能力創(chuàng)建一個實用的應用程序。具體來講就是Langchain為開發(fā)者提供了多模型訪問、Prompt的封裝、多數(shù)據(jù)源加載等多種接口,讓開發(fā)者構建AI應用更簡單。值得一提的是,Langchain在GitHub上短短幾個月內收獲了超過4萬個Star,十分受市場歡迎。
LangChain也在今年3月獲得1000萬美元種子輪融資,由風險投資機構Benchmark Capital投資。
另一家LlamaIndex公司推出的大模型中間件Routing,為AI開發(fā)者提供語義檢索、基于事實混合查找、訪問總結數(shù)據(jù),并且可以提供統(tǒng)一索引。
相關資料顯示,LlamaIndex公司由前Uber研究科學家Jerry Liu創(chuàng)立,目前LlamaIndex完成了850萬美元的種子輪融資,參與投資的包括Greylock,OpenAI創(chuàng)始人Sam Altman的弟弟Jack Altman等硅谷頂級投資人或機構。
Fixie也是一家大模型中間件初創(chuàng)公司,近期剛剛融資1200萬美金。Fixie將自己定位為大語言模型的自動化平臺,旨在幫助開發(fā)人員將任何大語言模型集成到客戶自己的應用程序中。該公司在社交媒體上的資料顯示:Fixie 可用于自動化業(yè)務流程,并將自然語言理解活用于現(xiàn)有產品、API 集成和數(shù)據(jù)托管。
Fixie 支持流行的模型,如 OpenAI 的 GPT-4 開箱即用,但客戶可以提供自己的模型或選擇其他商業(yè)和開放模型。
中國國內的大模型中間件初創(chuàng)企業(yè)也在崛起,靈奧科技推出的AI大模型中間件Vanus AI,也十分值得關注。Vanus AI可以幫助企業(yè)鏈接大模型和構建知識庫,并進行提示詞調試,最終搭建AI開放者自己的AI應用。
Vanus AI基于向量數(shù)據(jù)庫,幫助企業(yè)完成向量壓縮、模型打通、混合檢索、語義增強等過程,讓企業(yè)得以為大模型更新數(shù)據(jù)、用準確的企業(yè)知識庫結合提示詞工程消除幻覺,并提升安全性。
靈奧科技也在今年7月完成數(shù)百萬美元的種子輪融資,投資方為靖亞資本,Plug and Play。
靈奧科技團隊人數(shù)也較少,有十余人,是屬于初創(chuàng)型公司。團隊成員除了來自中國外,還有來自加拿大、澳大利亞等國家。
該公司CEO 厲啟鵬曾就職于阿里云等知名大廠,對于 AI 和云基礎設施有豐富經驗。團隊其他成員也多在華為、字節(jié)跳動、Forrester這些科技或互聯(lián)網(wǎng)大廠工作過,并且都是畢業(yè)于北京大學、倫敦國王學院、紐約大學、蒙特利爾大學這樣的頂級學府。
還有一家國內大模型中間件廠商瀾碼科技”于近日完成數(shù)千萬元A輪融資,該輪由IDG資本、聯(lián)新資本、Atom Capital參與投資。
公開資料顯示,瀾碼科技是一家基于大語言模型的數(shù)據(jù)飛輪公司,2023年2月在上海成立。基于底層?語?模型,瀾碼科技通過提供新一代?動化平臺,在專業(yè)場景下復現(xiàn)專家的專業(yè)技能,助力企業(yè)提升業(yè)務流程質量和效率。
瀾碼科技表示,本輪融資將繼續(xù)用于技術研發(fā)與產品創(chuàng)新,探索更多場景下大模型技術的應用和落地,賦能更多企業(yè)構建AI能力。
IDG資本對瀾碼科技寄予厚望,稱后者在AI領域有很強的技術落地和商業(yè)化能力。瀾碼科技率先填補了國內大模型中間層的空白,能夠助力企業(yè)實現(xiàn)AI能力的快速落地,共同挖掘AI大模型應用的高價值場景。
AI企業(yè)的創(chuàng)始人,往往都是名校學霸。瀾碼科技創(chuàng)始人兼CEO周健畢業(yè)于上海交通大學計算機系,于2002年獲得亞洲首個ACM國際大學生程序設計競賽世界冠軍,2006年加入谷歌負責中文網(wǎng)站搜索質量優(yōu)化,之后他又加入了了弘璣Cyclone 擔任CTO,后又在Google、阿里、依圖和MediaV任職,主要從事分布式系統(tǒng)研發(fā)。
03大模型中間件的市場機會有多大?
大模型在落地過程中會有許多問題,有的是非常棘手的,比如有資源調度、數(shù)據(jù)集成、模型訓練、應用集成、知識庫與大模型融合等問題。其中有三大主要問題,具體來講,第一方面是知識庫的構建。企業(yè)需要將存在現(xiàn)有系統(tǒng)中的語料匯總到向量數(shù)據(jù)庫,形成企業(yè)自有的知識空間。第二是AI應用的集成。AI應用需要服務的用戶可能存在于飛書、微信、Slack或者企業(yè)自有的業(yè)務系統(tǒng)。第三是數(shù)據(jù)安全性的問題,由于企業(yè)數(shù)據(jù)向量化的過程中需要調用公有云大模型Embedding接口。這個過程需要將企業(yè)數(shù)據(jù)切塊之后發(fā)送給大模型,具有安全隱患。
這些問題的解決,都是以大模型中間件為最佳。
對于AI創(chuàng)業(yè)而言,現(xiàn)在在美國硅谷是這樣的,大模型中間件的開發(fā)走向繁榮,像ChatGPT那樣的大模型卻很少有人再想去做。
由于目前那些科技和互聯(lián)網(wǎng)巨頭們都在搞大模型,中間層這塊肥肉他們現(xiàn)在還無暇顧及,這位哪些初創(chuàng)公司提供了巨大的機遇,在海外市場,中間層正在蓬勃發(fā)展,超過大家的想象。
正如云計算時代,Snowflake和 AWS 相互成就一樣。大模型時代,中間層和底層算力平臺也正在相互成就。我們都知道,這是因為算力供應商面對的最終消費者是AI開發(fā)者,而中間層的公司正在幫助AI開發(fā)者快速部署大模型,這進一步增加了底層云計算資源的消耗,為這些算力公司帶來利益。
這樣來說,中間層的火爆,直接決定了底層算力供應商管道的能開多大,同時也是上層AI應用開發(fā)者得以成功的重要條件。在硅谷,開發(fā)大模型中間件的一批公司正站在各自不同生態(tài)位上,把應用層抬進大模型時代,在這過程中,中間層自身也獲得了更大的利益。
在中國市場中,目前有兩家大模型中間件公司規(guī)模較大,一家是東方通,另一家是寶蘭德,其中間件產品主要應用于金融行業(yè)。
今年6月9日,創(chuàng)業(yè)板上市公司東方通在互動平臺表示 ,AI大模型訓練需要依托大量的硬件基礎設施來對海量數(shù)據(jù)來訓練和優(yōu)化,在數(shù)據(jù)處理和部署管理方面有著很高的要求。因此需要有高效的數(shù)據(jù)處理和管理中間件來支持大規(guī)模數(shù)據(jù)的存儲、傳輸和處理,支持模型的快速部署、監(jiān)控和調優(yōu)等,還需要通過中間件來支持多種不同的硬件和軟件環(huán)境,以滿足不同場景下的需求。因此,AI大模型和垂直應用模型的爆發(fā)將會加大中間件的需求。
同樣是上市公司的寶蘭德的董事長易存道在接受媒體采訪時表示,目前布局中間件的企業(yè)不是很多,因為中間件的技術門檻還是比較高的,想做好不是很容易。尤其在信創(chuàng)環(huán)境下,想把中間件做好更不容易。
由此可見大模型中間件的市場在國內來說,競爭不是很激烈,因為技術門檻高,進入該領域的企業(yè)少之又少,目前來看是AI領域細分市場中的風口行業(yè),初創(chuàng)公司如果能抓住機會。
風險投資機構XVC合伙人陸宜接受媒體采訪時表示,我們目前投了兩家與大模型相關的公司,一家做基于大模型的個人情感陪伴聊天,一家為大模型及AI應用落地提供基礎設施(大模型中間件)。當下國內大模型市場還處于快速發(fā)展的早期,雖然大量大廠、行業(yè)領袖已經躬身入局,但是對于創(chuàng)業(yè)公司來說,大模型基礎設施公司和應用型公司還有大量機會等待挖掘,投資機構也會緊密跟蹤。
雖然大模型中間件的市場前景很大,但這些相關創(chuàng)業(yè)公司也面臨著一定的市場威脅。比如最近半年來,一些大模型的能力也一再進化,并且還開放了插件。這樣對于大模型中間件廠商就提出了更高的要求,必須同時進化自己的產品,做大模型所不能做的事,這樣才能在競爭中立于不敗之地。
參考資料:http://news.sohu.com/a/685058743_115128
幾分鐘開發(fā) AI 應用成為可能,為什么說大模型中間件是 AI 必備軟件?
本文為專欄作者授權微新創(chuàng)想發(fā)表,版權歸原作者所有。文章系作者個人觀點,不代表微新創(chuàng)想立場,轉載請聯(lián)系原作者。如有任何疑問,請聯(lián)系http://www.i0562.net/。