上海AI實驗室開源工具箱XTuner 8GB顯卡就可訓練大模型
微新創想(idea2003.com)9月20日 消息:近日,上海人工智能實驗室發布了一款面向大模型訓練的開源工具箱XTuner,通過支持多種硬件適配,大幅降低了企業進行大模型訓練的門檻,尤其是對中小企業具有重要意義。
XTuner為各類開源模型提供了多樣的微調框架
XTuner支持與多款開源大模型的無縫銜接,可執行增量預訓練、指令微調等任務類型。開發者僅需使用8GB消費級顯卡,就可以訓練出適用于具體業務場景的“專屬大模型”。這極大地降低了進行大模型訓練的“真金白銀”成本。
XTuner還具備支持多種數據集格式適配、結合社區主流開源訓練框架、一鍵式標準化訓練流程等功能。這些“黑科技”令開發者可以更專注于數據本身,而其余訓練流程可完全交給XTuner自動化完成。
通過XTuner,開發者可以輕松為大模型添加新功能,例如賦予顏色識別、搜索引擎等能力。這有助于根據具體業務需求,對通用預訓練模型進行快速定制優化。
XTuner的發布再次鞏固了上海AI實驗室在大模型研發與應用領域的全鏈條開源布局。該實驗室此前已開源發布多項大模型工具,并提供免費商用。業內人士表示,這將推動我國在人工智能核心領域的技術進步。
開源鏈接:
https://github.com/InternLM/xtuner