AI視野:文心一言軟件著作權獲批;萬興科技發布大模型 “天幕”;Bing Chat確認100%采用GPT-4
???AI新鮮事
百度文心一言軟件著作權獲批
9月13日,百度“文心一言軟件”著作權獲批,8月31日向全社會開放,用戶可以在應用商店下載使用。
要點:
1.9月13日,百度“文心一言軟件”著作權獲批,當前版本為V1.0.0。
2.8月31日,百度文心一言APP向全社會開放,用戶可以下載APP或訪問官網使用。
3. 文心一言開放后迅速成為應用商店下載榜首,是首個中文AI原生應用登頂。
Bing Chat創意和精確模式全面采用GPT-4
微軟搜索主管Mikhail Parakhin確認Bing Chat在創意和精確模式下100%采用GPT-4。微軟同時使用多種語言模型,還包括GPT-4Prometheus和自有的圖靈語言模型。盡管大力宣傳AI聊天和GPT-4,但微軟在與Google的激烈競爭中仍需繼續努力以提高市場份額。
要點:
1. 微軟搜索主管確認Bing Chat在創意和精確模式下100%采用GPT-4。
2. 微軟同時使用多種語言模型,包括GPT-4Prometheus和自有的圖靈語言模型。
3. 盡管大力宣傳AI聊天和GPT-4,微軟仍需在與Google的競爭中繼續努力。
網友用AI復現電影名場面!Midjourney+Gen2,7步完成「芭本海默」
在前兩天芭比海默全網爆火之后,不斷有網友“復現”用MidJourney+Gen-2制作電影的神技!一網友甚至曬出教程,稱自己使用Midjourney和Gen-2在7步內完成類似電影「芭比海默」的動畫短片制作流程,并分析了目前這種生成方式的優勢和局限性。
要點:
利用ChatGPT編寫劇本和字幕,Midjourney生成圖片,再用Gen-2讓圖片動起來,最后合成就可完成類「芭比海默」短片。
現階段 biggest難點在于Gen-2生成的人臉比較容易畸變,需要多次嘗試找到較好效果。
如果未來Gen-2能夠跟prompt描述連動,制作復雜劇情的生成電影將可實現。
老黃自曝:3個月賣出800噸H100的英偉達是一個“三無”公司
有分析公司算出來,英偉達最新GPU產品H100僅三個月時間就銷售超過816噸。然而市值已超萬億的英偉達,竟是一個「無計劃、無匯報、無層級」的公司。
要點:
英偉達H100GPU三個月內銷量超過816噸,如果保持現在的銷售速度,今年全年可銷售3266噸。
英偉達CEO黃仁勛采取扁平化管理、不做狀態報告、重視員工想法的方式領導公司。
目前全球對英偉達H100GPU需求巨大,但供不應求,各大科技公司與云服務商爭相購買中。
谷歌修改“有用內容更新”政策 調整對AI生成內容的立場
谷歌最近更新了"有用內容"政策,調整了對AI生成內容的立場。這是該政策自2022年8月推出以來的第三次迭代。本次更新強調內容應該以人為本,而不僅僅是為搜索引擎而生成。谷歌表示會與OpenAI等公司合作,以幫助用戶識別內容的來源。可以預見,AI生成的內容在網絡上的比例會不斷增加。
要點:
1、谷歌調整了有用內容政策,改變了對AI生成內容的立場,強調內容應該以人為本。
2、谷歌承認監管AI生成內容存在困難,將與OpenAI等公司合作以幫助用戶識別內容來源。
3、可以預見,AI生成的內容在網絡上的比例會持續增加。
全球首臺AI汽車機器人“極越01”9月19日開啟預訂
極越汽車宣布將于9月19日推出全球首款AI汽車機器人極越01,開啟限時預訂,該車將成為中國首款搭載高通驍龍8295智艙芯片的車型。
要點:
1. 極越01是全球首款AI汽車機器人,將于9月19日首發亮相并開啟預訂。
2. 極越01將成為中國首發搭載高通驍龍8295智艙芯片的車型。
3. 極越01將基于SEA浩瀚架構,并由文心一言等AI技術全面賦能。
英國法官用ChatGPT撰寫裁決文件 狂贊:非常有用
英國法官首次公開承認使用ChatGPT撰寫法庭裁決書,稱其“非常有用”,他透露,他直接將ChatGPT生成的文字復制并粘貼到自己的裁決中。這一言論被認為是英國法官首次承認在工作中使用生成式人工智能軟件的案例。
圖源備注:圖片由AI生成,圖片授權服務商Midjourney
要點:
1、英國上訴法院法官Birss透露使用ChatGPT撰寫知識產權相關裁決書。
2、他直接將ChatGPT生成內容復制粘貼,稱其“非常有用”。
3、此舉引發爭議,ChatGPT可能生成錯誤信息,美國法官曾因使用它受批評。
《紐約時報》也開始招聘擅長生成式AI工具的高級編輯
《紐約時報》正在招聘一名高級編輯,負責將生成式人工智能工具引入其新聞編輯室,以確保時報成為該領域的領導者。該編輯還將制定使用GenAI的指導方針,平衡創新與風險。
要點:
1、紐約時報招聘高級編輯,負責引入生成式AI到新聞編輯室
2、編輯要確保時報成為GenAI創新及應用的領導者
3、還將制定使用GenAI的指導方針,平衡創新與風險
微軟推M365Copilot早期訪問計劃,為澳大利亞機構引入AI生產力工具
微軟宣布澳大利亞首批客戶獲得Microsoft365Copilot早期訪問計劃資格,該服務將大型語言模型與Microsoft365數據結合,為企業帶來強大的AI生產力增強。
要點:
1. 澳大利亞多家企業如AGL、Data#3、NAB等獲得M365Copilot早期訪問資格。
2. 金融服務業將是M365Copilot技術最快采納行業之一。
3. 能源和公用事業企業也開始試點該服務,以提高工作效率。
?????聚焦開發者
微軟推出全新預訓練模型phi-1.5僅13億參數常識推理碾壓Llama2
微軟研究人員推出了一個僅有13億參數的LLM模型Phi-1.5。結果表明,它在多個常識推理任務上優于參數量是其10倍以上的模型。這說明高質量數據比模型規模更為重要。
論文地址:https://arxiv.org/abs/2309.05463
項目地址:https://huggingface.co/microsoft/phi-1_5
要點:
1、微軟研究人員推出了一個僅有13億參數的LLM模型Phi-1.5。
2、Phi-1.5在常識推理任務上表現優異,優于多個參數量十倍以上的模型。
3、研究表明,模型參數規模不是決定性因素,高質量數據更為重要。
谷歌提出生成式圖像動力學:讓靜態圖片動起來
谷歌團隊提出“生成圖像動力學”技術,可以將靜態圖片轉換成動態無縫循環視頻,以及讓用戶與圖片中的對象進行交互。
項目地址:https://generative-dynamics.github.io/#demo
要點:
1. 從包含自然運動的視頻中提取運動軌跡,訓練獲得圖像動力學先驗模型。
2. 對輸入圖片預測像素級長期運動表示,轉換為密集運動軌跡,生成視頻。
3. 支持用戶通過拖拽交互,場景會根據點的位置和方向產生對應運動。
新加坡華人團隊開源全能「大一統」多模態大模型NExT-GPT
新加坡國立大學華人團隊開源全能多模態大模型NExT-GPT,支持任意模態輸入和輸出,實現文本、圖像、語音、視頻之間的轉換。
項目地址:https://next-gpt.github.io
代碼地址:https://github.com/NExT-GPT/NExT-GPT
論文地址:https://arxiv.org/abs/2309.05519
要點:
1. NExT-GPT支持任意模態的輸入和輸出,實現了從任一模態到任一模態的轉換。
2. NExT-GPT通過組合開源的編碼器、語言模型和解碼器實現了全能的多模態能力。
3. NExT-GPT實現了端到端的訓練和指令微調,具有較好的多模態表示對齊能力。
Autolabel終結人工標注!AI標注比人類標注效率高100倍
最近,一家初創公司refuel上線了一個AI標注數據的開源工具Autolabel,它能夠利用LLM(如GPT-4等)自動對數據進行標注,大大簡化了數據標注流程。與人工標注相比,Autolabel可將標注效率提高100倍,而成本僅為人工成本的1/7。
要點:
1、開源工具Autolabel能用LLM代替人工高效標注數據,效率提升100倍,成本僅1/7。
2、Autolabel支持主流LLM,可快速標注NLP數據集,準確率高達88.4%,超過人工標注。
3、Autolabel可估計標注置信度,不同LLM可平衡成本與質量,大幅降低標注門檻。
中國研究人員推ImageBind-LLM:通過ImageBind實現LLM的多模態指令調優方法
中國研究人員最近提出ImageBind-LLM方法,通過ImageBind實現了大型語言模型的多模態指令調優,提高了其響應多種輸入指令的能力。
項目網址:https://github.com/OpenGVLab/LLaMA-Adapter
論文網址:https://arxiv.org/abs/2309.03905
要點:
1. ImageBind-LLM支持圖片、文本、音頻、3D和視頻等多種模式的指令輸入。
2. 使用高效的調優方法,如圖像編碼器凍結和參數高效技術。
3. 提出基于圖像特征的視覺緩存模型,用于增強不同模態間的嵌入表示。
Calvin Wong開發首個設計師主導的AI系統AiDA
時尚創新者Calvin Wong開發了首個AI設計師助手AiDA,它能識別設計元素提供修改建議,但強調AI的目的是激發設計師創造力,而非取代人類。
要點:
1. AiDA是首個由設計師主導開發的AI系統,可以顯著加速設計從草圖到成品的過程。
2. AiDA通過圖像識別提供設計修改建議,但Calvin Wong強調其目的是“促進設計師創作”,而非“取代設計師”。
3. AI在時尚設計領域應用帶來個性化體驗、專業化設計工具和可持續性進步等變革。
AI修改肖像模型DiffAE :可隨意改變性別、年齡、表情、妝發等
DiffAE是一款強大的人工智能模型,能夠實現圖像到圖像轉換,可實現人像的年齡、性別、表情、妝發等方面的改變。DiffAE模型采用語義編碼器結合條件DDIM,實現人像圖像多方位的編輯轉換。
要點:
1. DiffAE模型包含語義編碼器與DDIM兩部分,前者抽取圖像高層特征,后者關注細節變化。
2. 模型可實現人像的年齡、性別、表情、妝發等多樣化改變。
3. 應用范圍廣泛,可為創意設計、素材制作等領域提供支持。
智源開源中英文語義向量模型訓練數據集MTP
智源研究院發布了一個包含3億中英文文本對的大規模數據集MTP,這是全球最大的開源中英文語義向量模型訓練數據集,旨在解決中文模型訓練數據不足的問題。
MTP數據集鏈接:
https://data.baai.ac.cn/details/BAAI-MTP
BGE 模型鏈接:
https://huggingface.co/BAAI
BGE 代碼倉庫:
https://github.com/FlagOpen/FlagEmbedding
要點:
1. MTP數據集包含1億條中文記錄和2億條英文記錄,是目前最大的開源中英文關聯文本對數據集。
2. MTP綜合多種數據源,包括各類開源數據集、網絡數據等,豐富了訓練數據。
3. 作為中國代表機構,智源持續開源大模型全棧技術,推動AI領域技術創新和協同發展。
斯坦福大學推出Spellburst 可簡化藝術創意轉化為代碼的過程
斯坦福大學的研究人員推出了Spellburst工具,利用GPT-4語言模型,可以讓藝術家通過語義輸入創作代碼,改進創意構思和編輯過程。
論文地址:https://arxiv.org/pdf/2308.03921.pdf
要點:
1. Spellburst讓藝術家以語義方式編輯作品,GPT-4生成對應的代碼。
2. 工具包含語義編輯面板,藝術家可以調整生成圖像的各個方面。
3. Spellburst幫助藝術家從語義空間更快地過渡到代碼空間,提高創作效率。
開源機器學習庫vLLM 提升大語言模型推理速度
開源機器學習庫vLLM通過PagedAttention算法和服務系統設計,在不改模型架構的前提下將大語言模型推理速度提升24倍,為降低LLM在實際應用中的部署成本提供了重要途徑。
項目地址:https://github.com/vllm-project/vllm
論文地址:https://arxiv.org/abs/2309.06180
要點:
1、PagedAttention注意力算法通過采用類似虛擬內存和分頁技術,可有效管理LLM推理中的關鍵值緩存內存。
2、vLLM服務系統幾乎零浪費關鍵值緩存內存,內部和請求之間靈活共享緩存,大大提升吞吐量。
3、配備PagedAttention的vLLM相比HuggingFace Transformers提升了24倍吞吐量,無需改變模型架構,重新定義了LLM服務的最佳水準。
???AI應用
韓國互聯網巨頭NAVER發布大型藝術繪畫模型DreamStyler
韓國互聯網巨頭NAVER子公司NAVER WEBTOON AI最近發布大型藝術繪畫模型DreamStyler,能通過文字或圖像實現不同藝術家風格的繪畫轉換,是數字藝術創作者的重要工具。
要點:
1. DreamStyler可以模仿梵高、畢加索等藝術大師的繪畫風格。
2. 通過訓練學習不同藝術風格的特征和轉換規則。
3. 用戶輸入圖像后可實現風格轉換,為數字創作提供更多靈感。
“裝逼”神器!BeFake允許你發AI“造假圖”
一款名為“BeFake”的新應用推出,它被稱為真人社交應用“BeReal”的“反面教材”,允許用戶編輯并分享虛假的生活照片。
要點:
1. BeFake允許用戶編輯照片呈現虛假生活,滿足社交平臺吹噓需求。
2. 應用方式類似BeReal,不同是上傳的照片經過虛假修飾。
3. BeFake滿足用戶在社交網絡上獲得認可和贊美的心理需求,反映用戶渴望在網上比闊氣。
Suno AI推文本到音樂模型Chirp v1可根據風格和歌詞生成音樂
Suno公司最新推出Chirp v1文本到音樂模型,可以根據風格和歌詞提示生成不同風格的音樂。它最大的改進是v1可以將流派(如搖滾、流行、韓流等)和描述(如旋律或快節奏)轉化為音樂。
要點:
1. Chirp v1可以根據流派和描述生成匹配的音樂,支持用[verse] [chorus]分段提示。
2. Chirp集成在Discord中,提供每月250個免費credit,還可購買更多生成次數。
3. 目前英語和搖滾表現最好,歌詞內容和結構會影響生成效果。
AI音樂創作助手Soundful 提供各種風格的音樂模板
Soundful是一個一站式音樂創作助手,它提供各種風格的音樂模板,使音樂創作變得簡單,只需點擊按鈕就能創作出專業水準的原創音樂。
體驗地址:https://my.soundful.com/
要點:
1. Soundful提供海量高品質音樂創作模板,涵蓋多種流派風格。
2. 提供大量可自由組合的鼓組、樂器、音效等音樂素材。
3. 簡單易用的在線音樂創作界面,一鍵導出高品質音頻文件。
面部換臉應用Reface 只需一張自拍就能將你植入視頻中
Reface是一款使用人工智能技術實現面部換臉的移動應用,用戶只需上傳一張自拍照,就可以將視頻或GIF動圖中的人臉替換成自己,實現身臨其境的沉浸式體驗。
使用地址:https://reface.ai/
要點:
1. Reface應用了領先的人工智能算法,實現高質量逼真的面部換臉效果。
2. Reface擁有簡單易用的移動應用界面,整個換臉過程只需要幾秒鐘。
3. Reface為大量用戶提供穩定流暢的人工智能計算服務,可以同時處理海量面部換臉任務。
AI提示語:一個支持AI聊天、AI繪畫的多功能平臺
AI提示語是一個集成AI聊天、AI繪畫等功能的人工智能平臺,提供豐富的AI模型、可視化應用構建器、大量免費應用和多端支持,旨在幫助用戶輕松創建和使用AI應用。
體驗地址:https://www.tishi.top/
要點:
1. AI提示語提供語言、圖像等各類領先AI模型,用戶可以輕松調用實現不同需求。
2. 通過可視化拖拽構建器,用戶可以無需編碼快速創建自己的AI應用。
3. AI提示語擁有大量免費高質量應用,還支持網頁、App、小程序等多端使用。
????大模型動態
萬興科技發布百億級參數多媒體大模型 “天幕”
在2023世界計算大會上,萬興科技宣布將發布國內首個以視頻創意應用為核心的百億級參數多媒體大模型“天幕”,提供更專業化的AI創新解決方案,涵蓋視覺、音頻、語言等多模態AI生成和優化的能力。
要點:
1、萬興科技在計算大會上宣布發布“天幕”百億級多媒體大模型,以視頻為核心應用場景。
2、“天幕”具備一鍵成片、AI美術設計等多種核心功能,提供專業化的AI創新解決方案。
3、除“天幕”外,萬興科技還展示了多款嵌入大模型能力的AI創新應用產品。
日本政府與科技巨頭聯手投資數億美元開發日語語言模型
日本政府與主要科技公司投資數億美元,致力于開發超越ChatGPT的文化敏感日語語言模型。該模型將在國家超級計算機上訓練,計劃明年以開源形式發布,參數規模超過300億。為評估模型對日本文化的適應性,研究人員開發了Rakuda排名系統,GPT-3.5在排名中表現最好。
要點:
1. 日本政府與科技公司投資數億美元,開發文化敏感日語語言模型
2. 模型將在國家超級計算機上訓練,明年以開源形式發布,參數超過300億
3. 開發Rakuda排名系統評估模型對日本文化的適應性,GPT-3.5排名第一