11月30日,由深度學習技術及應用國家工程研究中心主辦的WAVE SUMMIT+ 2022深度學習開發者峰會上,百度文心大模型再次升級,包括新增11個大模型,大模型總量增至36個,構建起業界規模最大的產業大模型體系。
【資料圖】
不久前,百度聯合人民網發布媒體行業大模型“人民網-百度·文心”,這是領先的大模型技術在傳媒行業的首次嘗試,旨在順應內容與技術發展,打造全媒體時代內容科技創新引擎。
人民網-百度·文心大模型基于文心大模型ERNIE3.0,引入人民網在傳媒行業積淀的行業知識與任務樣本數據,結合雙方在預訓練大模型技術和傳媒領域業務與算法的經驗打造。
人工智能是基礎設施,大模型已成為新方向
近些年來,人工智能的應用日益廣泛,“十四五”期間,我國媒體融合發展進入新階段,雖然不同層級和形態的媒體深度融合、整體轉型形式多樣,但引入先進的互聯網技術已成為行業共識。5G、大數據、云計算、人工智能等新技術被應用到新聞采編播發的各個環節,成為媒體智能化的基礎設施。
從內容發展形態來看,當下從文字到圖文到視頻,多模態的內容形式已成為常態,傳播路徑越來越短,傳播速度越來越快。與之相伴的是,以移動終端為傳播介質的新媒體成為傳媒輿論的主陣地,傳播形態和介質的變化導致新聞傳播規則和評價標準隨之改變。
對傳統媒體來說,加碼技術領域的投入迫在眉睫。從技術發展趨勢來看,隨著數據井噴、算法進步以及算力突破,預訓練大模型已成為人工智能發展的新方向,基于大規模知識和海量無結構數據融合學習、深度學習,在多模態內容理解上具備更強的能力,在內容生成上也有更好的表現,可以進一步提升內容創作效率,促進內容生態繁榮。
在媒體轉型浪潮的初期,“造不如買、買不如租”是大多數媒體的選擇,隨著改革的深入,自主開發受到不少媒體的青睞,但是“造游艇”和“造航母”,畢竟完全不在一個數量級上,預訓練大模型雖然作用巨大、前景廣闊,但受技術復雜、研發周期長、投入成本高等因素的制約,絕大部分媒體都不可能獨自踏入這條賽道。
以百度為代表的大模型生產企業,在大模型能力、海量數據、大規模算力等方面具有優勢,能夠根據AI應用方的需求,自動化、標準化地進行多場景多領域的模型生產,當達到一定規模時,即可形成健康、可持續發展的大模型產業模式。
“具有算法、算力和數據綜合優勢的企業,可以將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業提供大模型服務。”百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰指出,如此一來,大數據、大算力、大模型能力僅需少數企業操心,千行百業直接應用AI模型即可。
王海峰提出的這條產業化路徑,是媒體轉型過程中一種可行的模式。龐雜的系統和復雜的研發流程,對以內容見長的傳統媒體來說,不啻于一座大山,唯有借助合作伙伴的力量才有可能翻越。
值得一提的是,文心大模型與媒體行業的結合已經在一些場景上帶來了新模式。傳媒內參從百度方面獲悉,部分媒體“策、采、編、發”各個環節已采用人機協作的模式工作。此外,2022年北京冬奧會,大模型作為底層技術支持的AI數字人作為手語主播,為超過兩千萬的聽障人士觀看觀賽提供了高效、高質量的服務。
內容與技術的牽手:人工智能加持傳媒、大模型顯著提升行業效率
作為傳媒領域的AI基礎設施,百度與人民網計劃基于人民網-百度·文心大模型,打造全媒體時代內容科技創新引擎,通過集約化的大模型建設,實現以一個傳媒行業大模型底座支持多個細分業務場景應用,加快傳媒行業融合發展的步伐。
在百度文心大模型的技術加持下,人民網首批將自主可控的大模型應用于業務之中,將打造全媒體時代內容科技創新引擎,引領媒體行業的AI應用新方向。
在技術方面,以人民網-百度·文心大模型替換原有模型,在各類NLP(自然語言處理)場景上,顯著提升功能效果;在應用方面,集約化建設AI能力,突破效果瓶頸,實現更多傳媒業務場景的降本增效,如應用于文章摘要生成等內容生成類場景。
人民網-百度·文心大模型已應用于人民網的新聞摘編報告生成、新聞內容審核分類、輿情分析等重要場景上,取得了比較明顯的效果提升,大幅領先業界其他模型。
未來該模型還將用于新聞事件抽取分析、新聞評論聚合分析、新聞信息個性化推薦等更多領域,全面提升大模型對傳媒領域任務的適配能力,加快傳媒行業融合發展步伐。
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜表示,百度與人民網的合作由來已久,此次聯合發布媒體行業大模型,是人工智能前沿技術在媒體行業的最新實踐成果。
人民網輿情數據中心相關負責人表示,人民網輿情數據中心一直著力打造“輿情領航者”、“數據國家隊”和“數字經濟高端智庫”,依托人民網在內容科技戰略上的整體布局,積極探索AI技術在輿情場景的應用,推動輿情服務由人力密集型向智能密集型轉變。希望此次與百度在傳媒行業大模型的共建中能發揮雙方優勢,加速人工智能新技術在媒體行業落地。
大模型背后的底氣:技術賦能多個行業、應用版圖不斷擴大
文心大模型是百度自主研發的產業級知識增強大模型體系,全景圖由模型層、工具與平臺層、產品與社區層構成。
在模型層,文心大模型已經包括36個大模型,涵蓋基礎大模型、任務大模型、行業大模型的三級體系,全面滿足產業應用需求,構建了業界規模最大的產業大模型體系;在工具與平臺層,通過大模型開發套件、文心API和提供全流程開箱即用大模型能力的EasyDL和BML開發平臺,全方位降低應用門檻;產品與社區層,包括AI藝術與輔助創作平臺“文心一格”、產業級搜索系統“文心百中”和旸谷社區,讓更多人零距離感受到最先進的AI大模型技術帶來的新體驗。
以ERNIE為代表的基礎大模型是文心大模型最重要的基礎,也是百度開展的歷史最悠久的模型。從2019年至今,ERNIE已經迭代到了3.0版本,每一個大版本都有基礎技術的創新。人民網-百度·文心大模型正是基于文心ERNIE 3.0打造。
作為百億參數知識增強的大模型,文心ERNIE 3.0首次在百億級預訓練模型中引入大規模知識圖譜,促進了結構化知識和無結構文本之間的信息共享,大幅提升了模型對于知識的記憶和推理能力。相比較于沒有知識增強的大模型,文心大模型的學習效率更高,且在實體問答、知識預測、可控文本生成等多個場景上擁有更好的效果。
文心大模型在產業應用過程中打磨技術,并致力于持續降低應用門檻,推動產業智能化升級。
目前,文心大模型已大規模應用于百度搜索、信息流、智能音箱等互聯網產品,顯著提升了百度的產品效果和用戶體驗。從外部落地應用來看,文心大模型已通過飛槳開源開放平臺、百度智能云等賦能到工業、能源、金融、通信、媒體、教育等多個行業。
在媒體行業,文心大模型的理解和生成創作能力激發創意,提升內容多樣性,可降低制作成本;在保險領域應用中,文心大模型的智能解析能力,能使文本處理效率提升30倍;在醫療領域應用中,文心大模型將每份病歷的檢查時間,從30分鐘縮短到了秒級別……
從技術研發到落地應用,大模型發展已經進入產業落地的關鍵期,與產業場景需求的高度契合是大模型真正助力產業發展的重要前提。聯合行業頭部企業研制行業大模型就是百度文心的重要實踐。隨著人民網的加入,文心大模型再添新成員,應用版圖進一步擴大。截至目前,文心已累計發布11個行業大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領域,實現顯著的效果提升,產業生態初步形成。
責任編輯:李楠
分享到:版權聲明:凡注明來源“流媒體網”的文章,版權均屬流媒體網所有,轉載需注明出處。非本站出處的文章為轉載,觀點供業內參考,不代表本站觀點。文中圖片均來源于網絡收集整理,僅供學習交流,版權歸原作者所有。如涉及侵權,請及時聯系我們刪除!