(資料圖片)
8月16日消息,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰首次對外表示,飛槳開發者數已達800萬,服務22萬家企事業單位,基于飛槳創建了80萬個模型。
王海峰還闡釋了飛槳開發者社區AI Studio中文名“星河社區”的含義,“文心加飛槳,翩然赴星河”。“和所有的開發者一起,在飛槳和文心的加持下,共建星河社區,共赴通用人工智能的星辰大海。”王海峰表示。
王海峰提到,人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的核心基礎能力,這四項能力越強,越接近通用人工智能,而大語言模型具備了這四項能力,為通用人工智能帶來曙光。
具體而言,人工智能的典型能力如創作、編程、解題、規劃等都依賴于理解、生成、邏輯、記憶等核心基礎能力,依賴程度有所不同。以解題為例,從讀懂題目、解答題目到最后寫出答案,需要理解、記憶、邏輯及生成能力的綜合運用。
如何獲得這些能力呢?他以文心一言為例,首先從數萬億數據和數千億知識中融合學習得到預訓練大模型,在此基礎上采用有監督精調、人類反饋的強化學習和提示等技術,并具備知識增強、檢索增強和對話增強等技術優勢。
進一步地,通過多種策略優化數據源及數據分布、基礎模型長文建模、多類型多階段有監督精調、多任務自適應有監督精調、多層次多粒度獎勵模型等技術創新,全面提升基礎通用能力。在檢索增強和知識增強的基礎上,通過知識點增強,提升對世界知識的掌握和運用;通過大規模邏輯數據構建、邏輯知識建模、多粒度語義知識組合以及符號神經網絡,提升邏輯能力;通過構建數據、內容、模型和系統安全的全面安全體系,保障大模型的安全性。
效率方面,通過飛槳端到端自適應混合并行訓練技術以及壓縮、推理、服務部署的協同優化,文心大模型訓練速度達到原來的3倍,推理速度達到原來的30多倍。
應用方面,通過數據驅動、提示構建,以及插件增強進行場景適配,協同優化。文心一言已上線百度搜索、覽卷文檔、E言易圖、說圖解畫、一鏡流影五大插件,使模型具備生成實時準確信息、長文本摘要和問答、數據洞察和圖表制作、基于圖片的創作和問答、文生視頻等能力。
王海峰表示,未來百度將與開發者共建插件生態,共享技術創新成果。(一橙)
關鍵詞: