AI視野:百度發布量子領域大模型;Runway推出鏡頭控制功能;Colossal把大模型門檻打下來了
????大模型動態
百度發布首個量子領域大模型
百度發布首個量子領域大模型,以及百度量子助手和量子寫作助手兩大AI原生應用,旨在全面推動量子技術與大模型深度融合,釋放潛力。
AiBase提要:
? 百度發布首個量子領域大模型,深度融合量子技術與大模型。
? 百度量子助手降低百度量子平臺門檻,提高使用效率。
? 量子寫作助手高效創作量子領域文檔,促進知識產權沉淀。
智譜AI發布MathGLM數學模型,算術任務性能優于GPT-4
智譜AI最新發布的MathGLM數學模型在數學推理方面表現出卓越性能,準確率接近100%,明顯優于GPT-4。該模型能夠精確計算算術運算,提升中文數學解決能力,對不同年級數學問題和應用題也表現出良好的效果。
論文鏈接:https://arxiv.org/abs/2309.03241
Github鏈接:https://github.com/THUDM/MathGLM
模型下載:https://modelscope.cn/models/ZhipuAI/MathGLM
AiBase提要:
? MathGLM數學模型卓越性能:MathGLM在算術任務上準確率接近100%,勝過GPT-4。
? 提升中文數學解決能力:MathGLM能夠精確計算算術運算,提高中文數學解決能力。
? 多用途數學模型:MathGLM在不同年級數學問題和數學應用題上取得了出色的結果。
Deci AI推出8.2億參數的文本到圖像潛在擴散模型DeciDiffusion1.0
Deci AI最近發布了DeciDiffusion1.0,這是一項具有8.2億參數的文本到圖像生成模型,速度比傳統方法快3倍。它采用了創新的U-Net-NAS架構,通過四階段培訓過程提高了效率和圖像質量。用戶研究顯示,它在圖像美學方面有優勢,并在與文本描述的匹配上表現良好,為文本到圖像生成領域帶來了新的創新。
項目地址:https://huggingface.co/spaces/Deci/DeciDiffusion-v1-0
AiBase提要:
– ? Deci AI發布DeciDiffusion1.0,8.2億參數的文本到圖像生成模型,速度快3倍
– ? 采用U-Net-NAS架構,提高效率和圖像質量,經過四階段培訓過程優化
– ?? 用戶研究顯示在圖像美學和文本匹配方面表現出色,帶來文本到圖像生成領域的創新
百川智能發布閉源大模型Baichuan2-53B 并開放API
百川智能發布閉源大模型Baichuan2-53B,該模型在數學和邏輯推理方面表現出顯著提升,通過高質量數據體系和搜索方法減少了模型幻覺,并開放了Baichuan2-53B的API接口,進軍商業領域。
AiBase提要:
1. ? Baichuan2-53B全面升級,數學和邏輯推理能力顯著提升。
2. ? 百川智能優化數據體系,確保使用優質數據進行預訓練。
3. ? Baichuan2-53B開放API接口,進軍商業化領域。
恒生電子:恒生大模型產品LightGPT已開啟內測
恒生電子宣布,恒生大模型產品LightGPT已開始內測,該大語言模型專為金融領域打造,具有更專業、更合規和更輕量的特點。通過海量金融數據訓練,提升了對金融相關問題的理解能力,有望推動大模型在金融行業的應用。
AiBase提要:
? 專業性:LightGPT經過訓練使用了2000億中文tokens,覆蓋金融多個領域的應用場景。
? 合規性:LightGPT學習了中國的金融法律法規,符合中國金融市場的監管要求。
?? 輕量化:LightGPT支持私有化/云部署,通過API調用,部署成本較低。
度小滿“軒轅70B”金融大模型開源
度小滿發布了金融行業大模型“軒轅70B”,具有出色的通用能力和專業金融性能。該模型在中文任務評測和金融領域獲得高分,是首個參數量級達到70B的開源大模型,具備8k以上的上下文長度。它在預訓練階段融入了專業金融語料,采用加速優化策略,訓練效率出色。模型已在開源社區全面開放,為金融領域提供高效的中文基座模型,用戶可自定義微調,有望為自然語言處理和信息抽取任務帶來新機遇。
項目地址:https://github.com/Duxiaoman-DI/XuanYuan
AiBase提要:
1. ? 中文增強:軒轅70B通過中文增強和金融領域預訓練,提升金融領域理解能力。
2. ? 上下文長度擴展:首個70B參數級別開源大模型,上下文長度達8k以上,滿足金融領域長文本需求。
3. ? 專業性能:在金融領域評測中獲得顯著提升,成為處理金融文本的理想選擇。
阿里云開源通義千問140億參數模型Qwen-14B、Qwen-14B-Chat
阿里云于9月25日開源通義千問模型Qwen-14B及其對話模型Qwen-14B-Chat,免費商用。Qwen-14B在多項評測中表現卓越,接近Llama2-70B水平。
AiBase提要:
? 數據質量提升:Qwen-14B使用3萬億Token訓練數據,強化推理、認知、規劃和記憶。
? 對話升級:Qwen-14B-Chat基于強大基座模型,準確度提升,內容更符合人類偏好。
? 下載與調用:用戶可在魔搭社區或阿里云靈積平臺獲取Qwen-14B和Qwen-14B-Chat模型。
?????聚焦開發者
幾千元訓完中文版LLaMA2!Colossal-LLaMA-2把大模型門檻打下來了!
從頭預訓練大模型過去需要高達5000萬美元的投資,但Colossal-LLaMA-2降低了門檻。只需15小時和幾千塊錢的投入,即可訓練出中文LLaMA2大模型,性能接近SOTA水平,完全開源,可用于各領域低成本構建大模型。
AiBase提要:
? 低成本訓練:15小時、幾千元訓完中文版LLaMA2,降低大模型訓練成本。
? 性能提升: 中文版LLaMA2在多項任務上表現出色,達到SOTA水平。
? 全面開源: 開源訓練流程、代碼和權重,可廣泛應用于不同領域。
融資1億美元的類ChatGPT模型開源啦!可商用,8個模型
生成式AI平臺Writer獲得1億美元融資,開源了8個型號的大語言模型Palmyra,包括支持數據微調,適用于多個領域的型號。其中InstructPalmyra-20b支持高級自然語言處理,Palmyra-Med用于醫療保健,Palmyra-Large適用于多種業務場景,性能評測表現出色。Writer成為ChatGPT的主要競爭對手。
開源地址:https://huggingface.co/Writer
在線免費體驗地址:https://app.writer.com/organization/
AiBase提要:
? Writer獲1億美元融資,開源Palmyra大語言模型。
? Palmyra包括多個型號,支持數據微調,適用于不同領域。
? Palmyra在性能評測中表現出色,成為ChatGPT競爭對手。
UCSD 研究人員開源Graphologue:將LLM文本響應轉化為交互式圖表
大型語言模型(LLMs)如GPT-4因其生成各種用戶查詢的文本響應的能力而廣受歡迎。加州大學圣地亞哥分校的研究人員開發了Graphologue,這是一種新穎的技術,旨在通過實時將基于文本的LLM響應轉換為交互式圖形圖表來解決這些限制。Graphologue識別重要的文本組件,將它們組織成圖形表示,并從LLM答案中創建節點鏈接圖表,使復雜的關系和概念更容易理解。
項目地址:https://github.com/ucsd-creativitylab/graphologue
AiBase提要:
1. ? Graphologue改變了LLM與用戶之間的互動方式,通過引入圖形表示,使非線性對話成為可能。
2. ? 這項技術通過將文本響應轉化為圖形圖表,提供更清晰的可視化,幫助用戶更好地理解復雜信息。
3. ? 用戶可以積極互動,自定義圖形表示,促進更具動態性和個性化的對話。
中國研究團隊發布多視角數據集“FreeMan” 解決3D人體姿勢估計局限性
中國的研究團隊合作推出了名為“FreeMan”的大規模多視角數據集,旨在解決現有3D人體姿態估計數據集的局限性。該數據集包含來自8臺智能手機的1100萬幀視頻,跨足了室內和室外環境,具備不同光照條件,提供了更真實的場景多樣性。研究者通過自動化的標注流程生成了精確的3D標注,可用于多種任務。這一數據集的開源將推動人體建模、計算機視覺和人機交互領域的進步,彌合了受控實驗室條件與真實場景之間的差距。
項目網址:https://wangjiongw.github.io/freeman/
AiBase提要:
? 數據集多樣性: "FreeMan"包含1100萬幀視頻,涵蓋了室內、室外、不同場景和光照條件,為3D人體姿態估計提供更真實的數據多樣性。
? 自動化標注: 研究團隊開發了自動化標注流程,包括人體檢測、2D關鍵點檢測、3D姿態估計和網格標注,為多種任務提供了有價值的數據。
? 推動領域進步: "FreeMan"的開源將促進人體建模、計算機視覺和人機交互領域的進步,有望提高模型在真實場景中的性能。
???AI新鮮事
Runway推出鏡頭控制功能,提升AI視頻生成
Runway最新功能為AI視頻生成帶來精準鏡頭控制,包括運動速度和方向的調整,不僅適用于圖像生成視頻,還能用于文本生成視頻。此舉是應對競爭對手Pikalabs的舉措之一,兩者在AI視頻領域競爭激烈,各有優勢。Runway側重加強鏡頭控制,而Pikalabs致力于提升模型理解能力。AI視頻生成領域發展迅猛,文章提到了兩者的競爭情況以及未來的發展方向。
AiBase提要:
1. ? Runway推出精準鏡頭控制功能,可單獨調整鏡頭運動和速度。
2. ? 功能不僅適用于圖像生成,還可用于文本生成視頻。
3. ?? Runway和Pikalabs競爭激烈,前者加強鏡頭控制,后者提升模型理解能力。AI視頻領域競爭白熱化。
中文在線與華為云簽署合作協議 涉及大模型訓練等
華為云與中文在線簽署合作協議,重點合作領域包括大模型訓練,雙方將共同推動數字內容生態的發展。
AiBase提要:
– ? 合作協議簽署: 華為云與中文在線正式簽署合作協議,涉及公有云和AI等領域。
– ? 數字內容合作: 華為云將優先承載中文在線的大模型訓練內容。
– ? 業態多元化: 中文在線積極拓展多模態內容,包括文字生成漫畫和動態漫畫。
谷歌或于2027年自主生產AI芯片
谷歌計劃自主生產Tensor處理單元(TPUs),擺脫博通依賴,以降低成本,每年可節省數十億美元。
AiBase提要:
?1、谷歌考慮自主研發TPUs,不再依賴博通,旨在節省大量成本。
?2、與亞馬遜和微軟類似,谷歌希望自主研發AI芯片,預計每年可節省數十億美元。
?3、決策受博通價格策略影響,但最終尚未確定,谷歌重點是降低芯片成本和減少對Nvidia的依賴。
亞馬遜宣布向Claude 母公司Anthropic投資高達40億美金
亞馬遜宣布向人工智能初創公司Anthropic投資40億美元,以加強在云計算領域的競爭。這項交易將使亞馬遜的員工和云客戶能夠早期獲得Anthropic的技術,并整合到其業務中。該交易還表明云計算公司正在積極采取行動,以應對人工智能初創公司的崛起。
AiBase提要:
? 亞馬遜向Anthropic投資40億美元,加強云計算競爭。
? 員工和云客戶將早期獲得Anthropic技術。
? 云計算公司積極行動,抵御人工智能初創公司崛起。
新研究稱,利用AI創作者比人類更環保 碳排放更少
最新研究發現,基于人工智能的系統如ChatGPT、BLOOM、DALL-E2和Midjourney在文學和藝術創作方面,與人類創作者相比,碳排放明顯減少。
AiBase提要:
? 環保文創:AI創作者環保性能超越人類,碳排放顯著降低。
?? 文學藝術:ChatGPT、BLOOM等系統以小數千分之一的碳排放量完成創作。
? 質量比較:AI在一些任務上勝過人類,但在復雜任務中仍有局限。
好萊塢編劇就AI和薪酬問題達成“暫定”協議
好萊塢編劇工會(WGA)與電影電視制片和制作人聯盟(AMPTP)達成了一項“暫定”協議,結束了長達數月的罷工,涵蓋了2023年集體協議、薪酬和AI在劇本創作中的使用等問題,具體條款未公布。
AiBase提要:
?協議達成:好萊塢編劇工會(WGA)宣布與電影電視制片和制作人聯盟(AMPTP)達成了一項“暫定”協議,結束了長達數月的罷工。
? 涉及薪酬:協議覆蓋了新的2023年集體協議,包括薪酬和AI在劇本創作中的使用等所有問題,但具體的協議條款尚未立即公布。
? 罷工暫停:在工會董事會和會員批準之前,罷工將暫停,否則工會將繼續罷工。
引入Bard后,谷歌Gmail工具生成了一些虛構的電子郵件
谷歌最近將其大型語言模型驅動的聊天機器人Bard引入了一系列產品,包括Gmail、Google Drive、Google Docs、Google Maps以及谷歌旗下的YouTube等。盡管谷歌試圖將其新一代生成式AI與已有的產品線相結合,但似乎行動有些倉促。一名記者測試后發現,Bard AI制造了虛假的電子郵件,甚至錯誤地提供航班信息和虛構的列車信息。谷歌表示Bard擴展仍處于實驗階段,但這一產品引發了隱私擔憂,也讓人擔心谷歌在AI領域可能會犯一些嚴重錯誤。
AiBase提要:
1. ? 谷歌引入Bard,但AI制造虛假電子郵件,引發隱私擔憂。
2. ? Bard擴展試驗階段,錯誤提供航班和列車信息。
3. ? 谷歌將AI整合到多款產品中,但行動似乎倉促,引發問題。
Canalys預測:2027年將有60%的個人電腦兼容AI功能 出貨量預計超過1.75億臺
Canalys預測,到2027年,60%的個人電腦將兼容AI功能,出貨量預計將超過1.75億臺,兼容AI的個人電腦市場將迎來爆發式增長。
AiBase提要:
? 趨勢預測: Canalys預測2027年,60%的個人電腦將兼容AI功能,出貨量預計將超過1.75億臺。
?技術要求: Canalys指出,兼容AI的個人電腦必須配備可加快AI計算的芯片組或模塊,包括高通的Hexagon張量加速器、蘋果的神經引擎、英特爾的Movidius VPU和AMD的APU。
? 市場增長: 隨著Windows操作系統和AI工具的應用,2025年和2026年兼容AI個人電腦市場有望實現爆發式增長,到2027年,出貨量預計將超過1.75億臺,占總個人電腦出貨量的60%,年均增長率達94%。
???AI應用
Meta計劃推出AI聊天機器人服務「Gen AI Personas」
Meta計劃推出名為「Gen AI Personas」的AI聊天機器人服務,旨在挽回社交媒體平臺的用戶流失問題。然而,Meta的新產品受到了來自Character.AI的直接競爭,后者已經成功吸引了數百萬年輕用戶。雖然Meta希望通過這一產品吸引年輕用戶,但目前的反應復雜,不確定性較大。
AiBase提要:
? Meta計劃推出AI聊天機器人服務: Meta計劃推出名為「Gen AI Personas」的AI聊天機器人服務,具備個人助理功能、不同性格的聊天機器人選擇以及幫助用戶更好表達的能力。
? 直接競爭Character.AI: 與Character.AI相比,Meta的新產品主打「虛擬角色聊天」,但目前的虛擬角色設定被批評為過時,引發了復雜的用戶反應和疑慮。
? Character.AI的成功: Character.AI在短短兩年內取得了令人印象深刻的成功,擁有超過1500萬用戶,主要吸引18-24歲的年輕用戶,這使得Meta對其產生濃厚興趣并嘗試模仿。
Genmo AI秒殺Midjourney!3秒創作視頻、圖像和3D模型
Genmo是一款基于人工智能的創意產品,通過簡單的語言描述,能夠快速生成視頻、圖像和3D模型,為內容創作者、設計師和藝術家提供了強大的創作工具。
地址:https://www.genmo.ai/create/video
AiBase提要:
? 創意無限:Genmo利用人工智能技術,通過簡單的文字描述,能夠快速生成栩栩如生的視頻,用戶可以制作各類視頻內容。
? 多樣圖像生成:除了視頻,Genmo還提供強大的圖像生成功能,用戶只需輸入文字描述,就能獲得多樣風格的高清圖片。
?3D模型輕松制作:Genmo的3D生成功能讓用戶能夠輕松創建各種3D模型,應用范圍廣泛,無需專業技能。
豆繪AI:專注為建筑設計從業者提供空間設計AI服務
豆繪AI平臺是南京豆繪科技有限公司的產品,專注于為建筑室內園林景觀從業者提供空間設計AI服務,包括AI繪圖、AI設計助手和AI全景合成。它通過將AI技術與藝術領域相結合,協助用戶提高繪畫技巧,實現創作效率。
體驗地址:https://www.douhuiai.com/
AiBase提要:
1. ? 專注建筑設計:豆繪AI平臺為建筑室內園林景觀從業者提供AI服務,致力于簡化設計工作。
2. ? 多功能平臺:平臺擁有多項功能,包括AI繪圖、AI設計助手和AI全景合成,不斷更新改進。
3. ? 技術驅動發展:豆繪AI的長期目標是通過技術推動行業進步與效率提升,改變行業的發展格局,使從業者受益于科技的便利。