3300萬美元把公司賣給Salesforce,轉身拿著這筆錢天使投資HuggingFace,現在又想挑戰Google的搜索引擎!
編者按:本文來自微信公眾號 有新Newin(ID:NewinData),作者: 有新,微新創想經授權轉載。
今天為大家帶來 You.com 背后的創始人故事與思考:
-
囤了24年的頂級域名
-
從 LLMs 到搜索2.0
-
You 的產品組合與商業化
-
如何看待應用層的含金量?
enjoy ??~
01囤了 24年的頂級域名
1996 年,時任甲骨文銷售高級 VP 的 Marc Benioff 正在夏威夷的海灘上放假,他突然意識到了互聯網即將發生的大事,網絡世界將會成為現實的鏡像他思考了數字孿生的概念并思考著什么東西會出現在互聯網上,于是他開始購買域名,搶購數字世界的一小片土地以構建未來。
在 Marc Benioff 當時購買的域名中就有 You.com;在 1996~2020 年間,Benioff 一直持有這個域名,直到他找到了這個域名的繼任者 —— Richard Socher。
2003 年,Socher 剛開始在萊比錫大學學習計算機科學,而后輾轉計算機視覺并獲得碩士學位,其中涉及了更多統計和模式識別、統計學習的內容,隨后受到深度學習和神經網絡在計算機視覺的啟發,開始探索在自然語言領域的應用,最終為 Socher 在大模型領域的發展奠定了基礎。
2014 年,Marc Benioff 和 Richard Socher 相遇,當時 Socher 剛在斯坦福大學完成博士學位,并在那里開創教授了一種計算機理解自然語言的新方法,神經網絡在理解 Facebook 照片以及將文本從英文翻譯成中文等方面引起了不小的關注,但還不能理解語言的含義,Socher 的研究證明了神經網絡通過上下文和詞匯間關系建模可以解決這些問題,這也為 Socher 贏得了在普林斯頓大學工作的機會,不過學術界終究是沒待太久,最終 Socher 決定通過創業繼續自己的研究。
Socher 當時創辦了一家名為 MetaMind 的公司,通過神經網絡來為其他公司執行任務,從輿情分析再到醫學檢測,這項技術設計的非常簡單,不需要開發人員就可以使用,如果想要執行復雜的機器學習任務,只需要提出問題就可以了,Socher 在 2015 年的采訪中表示 MetaMind 和搜索引擎的區別是前者給出了答案,后者只返回了一堆鏈接。
這項技術在當時吸引到了 OpenAI 的第一位風險投資人旗下的 Khosla Venture 以及 Marc Benioff 的注意,兩方共同投資了 MetaMind 800 萬美元的種子資金,Richard Socher 從 CEO 轉任 CTO。
2016 年,這家公司被 Salesforce 以 3300 萬美元收購,成了今天 Salesforce Einstein ,用于幫助銷售人員跟蹤銷售機會;以及 Wave(現稱為 Einstein Analytics)、Salesforce 的基于云的分析軟件等產品。
Socher 也因此加入 Salesforce 擔任首席科學家,與此同時,Socher 身為斯坦福大學兼職教授的索切爾先生提倡一種以研究為導向的文化,強調發表研究論文;根據 Salesforce 統計,在 Socher 領導下的 17 個月內,Salesforce Research 發表了 20 篇研究論文。因此,Socher 的加入為 Salesforce 培養了大批 AI 人才。
在 Salesforce 時期,大公司內部的成熟管理模式帶給 Socher 良好的市場營銷和更好管理經驗,這讓 Socher 意識到隨著公司的成長,設立專門的研究團隊是有道理的,現有的公司以此有更大的概率把握未來的科技發展方向,并在某些情況下,實現這些預見,而對于一個小型創業公司,則可能過于奢侈,創業公司需要更多的關注如何“活在當下”你必須在相對短的時間內推出一些可以交付的產品。
同時,Benioff 不僅扮演著 Socher 的老板,更是一位創業導師,這讓 Socher 學會譬如在一些重大決策時,需要多聽取意見等經驗教訓,在 Socher 看來 Benioff 打造了一家了不起的公司,他不僅關心客戶,也關心整個地球、生態系統、當地學校、環境等等方方面面。
隨著當初公司被收購,Socher 也因此獲得了大量現金,一邊是買了一塊價值 300 萬美元的牧場開始享受生活,一邊則是做起了天使投資,包括他于 2015 年在斯坦福大學教授 CS224 學生們所創辦的項目,其中之一就有我們熟知的 HuggingFace,當時 Julien Chaumond 通過這項課程的學習小組和朋友 Thomas Wolf 在 2017 年 3 月創立了 HuggingFace,而 Socher 通過 Wolf 接觸了這個項目并在 2018 年 5 月投資了種子資金,而上月底 HuggingFace 剛完成 D 輪融資,估值已經達到了 45 億美元。
02從 LLMs 到搜索2.0
一直以來,Socher 都是單一大模型的支持者,今天 You 在這方面也取得了一些進展,但是在兩三年前,市場主流的觀點仍然還停留在每個任務都需要建立獨立模型,比如那時會有一個情感分析模型分析推文積極或者消極,摘要模型進行摘要,翻譯模型進行翻譯,問答模型完成問答,Socher 認為大模型的訓練應該像維基百科一樣,通過人們不斷的增加內容,將這個詞典變得更好,而不是每個相邀構建詞典的人都從頭開始構建詞典公司。
之所以當時的學術界和工業界都認為需要獨立的模型去完成不同的任務,而不是由一個統一的大模型去完成,原因在于這中間需要讓 LLMs 來融入世界知識,還需要具有注意力機制、更快的 GPU 和硬件等多種因素平衡才能讓模型正常工作,而在 10~20 年前市場上只有非常小的模型時,要實現今天的效果幾乎是不可能的。
2020 年,已經在 NLP 領域工作了十年的 Socher 依然有個想法困擾著他,也就是目前仍然沒有看到有人將 AI 應用到有史以來最大的商業模式 ——“在線搜索”中,于是 Socher 拉來了在 Salesforce 的伙伴 Bryan McCann 一起創辦新項目,當 Benioff 看到了 Socher 遞來的辭職信,失望的同時也知道擋是擋不住了,不如順水人情,一邊掏出了自己藏了 24 年的頂流域名 You.com ,另一邊在 2021 年領投了 You.com 的種子輪。
2022 年,You 當時的用戶規模達到數十萬,當年 6 月份的注冊量就達到 70% 的增速,而獨立搜索量則每月增長 30%,雖然和 Google 以及 Bing 之類的頂級搜索引擎相比猶如小巫見大巫,不過 Socher 在早期非常在意用戶的留存情況,而將 You 設置為默認搜索引擎的人中有 50% 的用戶仍然會繼續使用。
今年上半年在 Google 匆忙的完成發布會后,Socher 表示 Google 以及 Bing 這類傳統搜索引擎領域的主要參與者正在面臨典型的創新者窘境,拿 Google 來說,其通過用戶的隱私在搜索結果頁面展示更多廣告,每年賺取 1500 億美元,Google 每年還要像 Apple 支付 150 億美元作為默認搜索引擎的費用,這足矣說明其壟斷地位。
Sicher 認為生成式 AI 的出現并不等于帶來更多的盈利,而是會減少廣告的展示次數,比如原先一個頁面 6 個廣告,現在用戶只會看 1 個廣告,相當于每天減少 5 億美元的收入,用戶并不想看到那么多廣告,但實際上會看到一堆帶有廣告的 SEO 網站,對于通過廣告變現的搜索引擎來說,微軟也差不多,只不過這塊業務占比并不大,微軟也愿意保持一定虧損來換取更好的市場份額,而融入新的 AI 功能則可以換取更大的市場份額。
當被媒體問及如何看待生成式 AI 在搜索領域的商業化時,Socher 認為在聊天中添加個性化的廣告,就像是 DuckDuckGo 可能做的事情,這取決于用戶的 Query,今天我們看到有很多網友沉浸在 reddit、tiktok 以及 chatgpt 上,這說明用戶依然在找一些其他內容,但這些內容和渠道并不足以替代 Google 這樣的搜索引擎,這就是為什么 Socher 覺得 You 會有機會,試想一下當一個聊天機器人只給你答案,而不是將流量分配給個人、雜志或者出版商時會發生什么?Socher 認為的搜索2.0 將是這些內容提供方在搜索引擎上有一個類似“應用”的位置,當用戶喜歡它,它就會在聊天中不斷出現。
03You 的產品組合與商業化
You.com 除了搜索引擎,也提供其它的工具和服務,類似 OpenAI,你還能看到 You 版的寫作工具、圖像生成工具、代碼生成工具以及開放平臺等方面:
-
搜索功能
You.com 的搜索引擎從微軟 Bing 獲取搜索結果,同時也擁有自己的網絡爬蟲,被稱為 YouBot,用戶可以通過插件設置 You.com 為默認的搜索引擎,并在搜索結果頁面上獲取相關信息;
-
YouChat 聊天工具
YouChat 是一款由人工智能驅動的會話式搜索助手。它能夠回答問題、提出想法、翻譯文本、總結文章、撰寫電子郵件和編寫代碼片段,可以與其他平臺(如 Reddit、TikTok、Stack Overflow 和 Wikipedia)結合使用;
-
YouWrite 寫作工具
YouWrite 是一款AI寫作工具,旨在幫助作家、作者和博客作者克服寫作障礙,提高寫作技能。它可以幫助創建各種類型的書面內容,如電子郵件、博客文章、小說、散文和社交媒體帖子,YouWrite 使用 OpenAI 的 GPT 語言模型,根據文本類型、目標受眾和所需音調等信息生成內容;
-
YouImagine 圖像生成工具
YouImagine 通過AI生成圖像,使用穩定擴散等技術,允許用戶使用文本描述來生成AI生成的圖像;
-
YouCode 代碼生成工具
YouCode 類似于編程資源網站,如 Stack Overflow 和 GitHub,它為開發人員提供搜索功能,可以找到編碼問題的解決方案、生成代碼片段、訪問相關文檔和學術出版物等;
-
OnePlatform 開放平臺
You.com 的開放搜索平臺允許其他人創建定制應用程序,稱為“搜索應用”,來定制搜索結果頁面的體驗;用戶可以通過點贊或點踩影響應用程序的排名,并可以阻止某些應用程序出現在搜索結果中。該平臺目前提供了 200 多個第一方應用程序,可以在搜索結果頁面上獲取摘要信息或完成任務。
對于開放平臺,Socher 希望長遠來說有更多優質的第三方貢獻應用以及內容,如果用戶從應用或者內容中提取了好的上下文,且 You 能夠商業化,那么這部分利潤也可以與應用或者內容提供商共享。
這也是 You 比較有意思的地方,它實際也是一個社交媒體搜索引擎,畢竟 Google 和Bing 都沒有提供能夠抓取世界上最受歡迎的社交網站的搜索類別,而You 融合了 TikTok、Twitter、Facebook、Instagram、Reddit、YouTube、Quora、Twitch 上的內容,你可能會找到更多最新信息。
對于想要體驗 You 的用戶來說,你需要在 You.com 上創建賬戶,AI 會根據你的使用偏好改進搜索結果,將信息減少到最相關,而不同于傳統的搜索引擎想要讓你不斷刷內容看廣告,而 You 上的搜索結果會以“應用”的形式呈現,主打讓用戶可以一目了然的找到答案,或者直接從結果中完成下一步的操作。
You.com 目前的收入主要來自三個方面:
-
推廣鏈接(Affiliate Links):You.com 通過引入用戶點擊特定鏈接并購買商品的方式獲取收入,當用戶通過 You.com 的搜索結果點擊某個商品鏈接并最終購買該商品時,You.com 可以獲得與該銷售額相關的傭金。這種盈利模式是通過推動用戶購買來賺取傭金的方式;
-
SaaS訂閱:You.com 提供一個可選的月度訂閱計劃,用戶可以選擇支付訂閱費用來獲得其提供的寫作工具,這意味著用戶可以付費使用特定的寫作工具,從而為公司帶來穩定的收入來源;
-
廣告展示:You.com 通過在搜索結果頁面上展示例如沃爾瑪的廣告,從中獲取一部分廣告費用作為收入,這種模式類似于在用戶的購物搜索結果中顯示廣告,從中獲得收益;
04如何看待應用層的含金量?
生成式 AI 的應用層含金量有多少?Socher 認為確實存在一些價值很薄的公司,幾乎沒有護城河,但實際上又有很多人并不了解建立一個可行的業務所需要的整體要素有哪些,某些情況下這容易被低估。
Socher 以 Instagram 舉了個例子,Instagram 的護城河是什么?顯然不是 Instagram 的 AI 和軟件工程有多厲害,如果按今天生成式 AI 的邏輯去套,可能小扎連 LLMs 都沒加上, 看起來只是一個簡單的照片分享軟件,然后帶了一些濾鏡功能,而實際上 Instagram 的護城河在 AI Infra 之外,它有強大的分發、合伙伙伴以及渠道等等。
Socher 認為 LLMs 就像你的大嘴巴叔叔,它記不得你所有的往事和細節,有時候還會夸大其詞,所以你需要給“他”提供更客觀、更新的事實,以便“他”對正確的事情進行推理,雖然 You 的搜索引擎用到了 Bing 的搜索結果,其它工具用到了 GPT 的 API,但說是完全套殼且價值很薄,Socher 認為這么想就太膚淺了
站在一家創業公司的角度,Socher 表示在 LLMs 出現以前,創業公司是無法構建一個可以理解多種不同語言的搜索引擎的,而現在基于市場上的 LLMs 已經可以快速構建 80% 的解決方案,然后在 MVP 的基礎上添加更多的功能。
Socher 認為在某種程度上 LLMs 可以視為數據庫,用哪種數據庫都可以,這個不是最主要的,關鍵是如何使用數據庫,如何調優,如何對訓練數據微調,如何檢索事實并對所有這些事進行合理的推理,如何多次思考得出結論,這些過程中的細節會越來越重要。
因此,在 Socher 看來,在不同模型之間切換,更重要的是如何整合多個不同的模型,比如有的基礎模型適合處理自然語言表述,有的垂直模型適合財務預測,關鍵是如何讓這些模型絲滑配合,在該問的場景給到用戶匹配的結果,目前 You 也在用不同模型廠商提供的模型,但在生產中也會用自己的 LLMs,所以并沒有哪家模型廠商占據主導地位。
對于 AGI 方面的看法,Socher 認為目前人們的擔心過多了,從本質上講,目前的 AI 僅限于如何預測下一個 token,但是一個智能體要被認為是智能,它需要有自己的目標,而我們今天能看到的“智能”,如果不能在一個人類社會框架之中,為企業帶來效益,為政府帶來更好的經濟,那么就沒有人會去想這些事情,就更沒有人來讓 AI 設定自己的目標
對于 AI 的未來,Socher 比較樂觀,比較有趣的觀點是 AI 對許多工作會有實質性的影響,隨著更多的工作數字化和自動化,物理任務會越來越貴,比如建造房屋的木工成本會越來越高,這會成為新的瓶頸。
本文為專欄作者授權微新創想發表,版權歸原作者所有。文章系作者個人觀點,不代表微新創想立場,轉載請聯系原作者。如有任何疑問,請聯系http://www.i0562.net/。