過去一年,大語言模型的浪潮,讓越來越多人看到了通向通用人工智能的道路,整個科技界、產業界也非常興奮。數據顯示,目前中國10億參數規模以上的大模型已經發布了70多個。
那么,大模型價值在哪?如何做出AI時代的爆款應用?
卷大模型沒意義,卷應用機會更大
【資料圖】
百度集團執行副總裁、百度智能云事業群總裁沈抖表示,對于組織和企業來講,大模型會帶來新的智能生產范式。員工不用花大量的時間死記硬背常規的知識,有問題問大模型,大模型就會給出答案。同樣,大模型會改變人和機器之間的關系,可以顯著提升專家的工作效率,專家就可以把時間花在真正有創造性的工作上去,而且更主要的是大模型有強大的理解和生成能力,它能夠整合不同領域的知識,創造出前所未有的AI。
百度創始人、董事長兼首席執行官在2023年百度云智大會上指出,模型本身并不直接產生價值,基于基礎大模型開發出來的應用才是模型存在的意義。他認為,對于創業者來說,卷大模型沒意義,卷應用機會更大。就像移動互聯網時代,操作系統只有安卓和iOS,而特別成功的應用有很多,只有在大模型的基礎之上,產生了足夠多的AI原生應用,才是一個健康的生態環境。
李彥宏指出,AI原生應用要能解決過去解決不了、或解決不好的問題,而不是對移動互聯網APP和PC軟件的簡單重復。他認為,AI原生應用應該滿足三個基礎條件:一是能夠用自然語言交互,二是充分利用大語言模型的理解、生成、推理、記憶等能力,三是每個應用的交互不超過兩級菜單,所以交互會更簡單。
百度的目標是打造好大模型的基礎能力,支持好AI原生應用開發。最新的文心大模型3.5版本,模型效果提升了50%,訓練速度提升了兩倍,推理速度提升了30倍。不久后,百度將推出文心大模型4.0版本。文心大模型是最好的大模型之一,只有最好的大模型,才能長出最好的AI原生應用。百度希望創業者在文心大模型之上,可以做出AI時代的爆款應用。
沈抖堅信,2023年一定會成為AI原生業務的元年,在大模型推動下所有行業都會迎來深度重構,共同建立一個繁榮的大模型產業生態,用更高效的算力基礎設施、更豐富的行業解決方案、更全面的全國服務網絡,讓每一個行業、每一位客戶都能更好的駕馭大模型,實現規模化的產業創新,讓大模型成為推動我國產業優化升級、實現經濟高質量發展的新動能。未來將有更多偉大的產品和應用誕生在百度的客戶和伙伴的手中。
大模型驅動云計算創新變革
在百度集團副總裁侯震宇看來,作為基礎設施的云計算,在大模型的驅動下,AI原生應用的引領下,它的發展從經典的云逐步進化到AI原生云,將會重塑云計算產業的格局,生成式AI大模型會催生一個研發的新范式。
第一,對AI原生應用提出了新的架構要求。構建一個新的AI原生應用一方面肯定是模型,需要有模型能力,模型能力將會以API調度的方式來提供服務,這里的模型不止包括基礎大模型,同時也包括托管在百度平臺上的客戶經過微調的自己的模型。無論是動態編排還是靜態編排,用大模型獨有的能力實現鏈式調用;另一方面,新的服務即MaaS能力將成為一個基礎性能力,MaaS需要具備豐富、易用和面向AI原生應用的三個特點,未來不可能有一個大模型解決所有的問題,最終落地到場景里面需要有不同模型組合滿足不同客戶在不同場景的需求。
第二,大模型平臺要足夠簡單易用,需要有全套的工具鏈覆蓋從數據收集、標注到模型研發、訓練、評估,進而再到模型推理優化的全生命周期。此外,數據對于AI的研發非常重要,平臺既要提供更多的數據集,同時平臺也應該幫助客戶建立起屬于自己的數據驅動數據閉環的能力,更好地支持客戶的模型能力的迭代,以激發其業務更快速的發展。
第三,新計算大模型需要有大量數據的高密度計算,它對計算體系結構帶來了新的要求。目前,計算負載在加速向異構計算遷移,而且規模越來越大,微秒級互聯將成為算力規模化發展的關鍵能力,這些都需要從整個體系結構的層面上用軟硬一體的思路和方法去解決。
大力開展基于國產AI芯片的大模型系統研究
中國工程院院士鄭緯民指出,在國外的GPU卡一卡難求(價格非常高),國產的卡不喜歡的情況下,除了要改變國產卡的生態系統不好的局面外,更要考慮大模型基礎設施平衡設計。
首先,半精度運算性能與雙精度運算性能的平衡。設計中不僅要考慮半精度運算性能,還要考慮雙精度運算能力,雙精度與半精度運算性能之比為1:100比較合適。根據科學計算( AI For Science)和大模型訓練的發展趨勢,變精度平衡設計的思想很重要,適應科學計算和更廣泛的AI算法和應用提供保障。
其次,網絡平衡設計。網絡設計不能只針對CNN算法,還需考慮極大規模預訓練模型對系統的需求,大規模預訓練模型需要高帶寬低延遲網絡。
再次,體系結構感知的內存平衡設計。針對環網、存控可能帶來的性能問題,可以利用核間通信輔助、排布核組訪存模式,兩種優化方式可以帶來5.3倍性能提升。針對體系結構特點設計應用程序的訪存模式,最大化利用硬件性能。
最后,io子系統平衡設計。系統的本地nvme ssd僅通過本地文件系統訪問,限制了其應用范圍。將每臺服務器上的快速本地nvme整合成應用可見的全局分布式文件系統。
鄭緯民認為,怎么讓一塊 GPU發揮兩塊、甚至三塊的能力?大模型基礎設施平衡設計的四點考慮做得好,相信別人要用1萬塊卡,我們用9000卡就可以了。
百度集團副總裁袁佛玉認為,大模型時代的生態體系,會有三個重大特點。第一,應用生態的位置將更加核心;第二,擁有行業專業知識的企業迎來巨大機遇和挑戰;第三,初創企業與開發者將帶動生成式AI的應用繁榮。
第26屆論道啟動!11月相聚春城昆明,共尋智能視聽新增長。點擊圖片報名參會~
責任編輯:房家輝
分享到:版權聲明:凡注明來源“流媒體網”的文章,版權均屬流媒體網所有,轉載需注明出處。非本站出處的文章為轉載,觀點供業內參考,不代表本站觀點。文中圖片均來源于網絡收集整理,僅供學習交流,版權歸原作者所有。如涉及侵權,請及時聯系我們刪除!關鍵詞: