記者從中國電信獲悉,2023世界人工智能大會期間,中國電信數字智能科技分公司(下稱電信智科)正式對外發布中國電信大語言模型TeleChat,并展示了大模型賦能數據中臺、智能客服和智慧政務三個方向的產品。
電信智科副總經理何忠江表示,近年來,人工智能開始爆發性增長,并進入生成式AI時代。在這過程中,人工智能從機器智能、感知智能轉化為認知智能,即通過抽象推理的方式理解自然語言。
(資料圖)
“其中,GPT模型是人工智能技術發展變遷的重要代表,作為一種自然語言處理模型,GPT模型通過在大型文本語料庫上的訓練學習到語言模式用于生成自然語言文本,為信息檢索、機器翻譯和文本摘要等多類任務提供了有效的解決方案?!?/p>
中國電信表示,公司依托云網融合的優勢,打造了中國電信的大語言模型TeleChat。據介紹,TeleChat使用了大量高質量中英文語料進行預訓練,并采用了千萬級問答數據進行微調。同時,設計了漸進膨脹注意力機制,用于增加模型的間隔采樣,擴大實際感受野;研發了自校準微調技術,將迭代后相關性偏差作為強化學習的監督信號,提升強化學習效果;并且利用知識圖譜協同增強策略,通過知識圖譜增強大模型的預訓練和推理能力,減少大模型幻覺現象。
此外,以TeleChat為底座的教育版大模型TeleChat-E在全球大模型綜合性考試評測榜單C-Eval上排名第七,前幾名包括GP4、ChatGPT等知名大模型。TeleChat-E使用人工收集、標注、整理的高質量領域數據對TeleChat進行持續效果強化。同時,TeleChat-E對Transformer Decoder的損失函數進行改進,使之更加關注題目答案的生成,提高準確率。
何忠江指出,通過大模型機制,神經網絡已經可以愈加擬人化。在當下,電信TeleChat大模型正在與千行百業的信息化解決方案進行融合,在諸多行業實現商業化落地。
一是大模型+數據中臺產品。中國電信演示了將AI能力和數據中臺深度融合,打造AI智能取數能力,基于大數據平臺生成的可視化圖表。目前已實現大數據中臺大模型將數據平臺的權限和脫敏能力打通,使用戶可以獲取到自己權限范圍內的數據表中脫敏后的字段值,比如姓名、電話號碼等。當進入到AI取數模塊時,用戶可以根據自身需求讓大模型生成SQL、可視化圖表和分析報告。
二是大模型+智能客服產品,TeleChat大模型能夠輔助坐席或用戶快速獲取文章和材料內的信息。在現場演示中可以看到,通過一站式人機融合知識中臺查看產品介紹材料,再激活大模型懸浮對話框,接下來上傳需要模型理解的文件,即可得到理解后生成的反饋。在TeleChat的幫助下,坐席無需閱讀全文找答案,既解決了模型幻覺問題,還能夠做到知識庫管理權限隔離。
三是大模型+智慧政務產品,中國電信TeleChat大模型依托5G消息,為政務客戶提供政務短信智能化多輪問答,進行行業領域的基礎語言模型訓練和領域問答能力微調,并基于領域問題反饋的強化學習,最終實現對行業領域專業問題的精準回答和平臺推送反饋。
記者注意到,不僅僅是中國電信,國內三大電信運營商都已經入局大模型賽道。上周,中國聯通發布了圖文大模型“鴻湖圖文大模型1.0”。中國聯通稱,鴻湖圖文大模型是首個面向運營商增值業務的大模型,該大模型目前擁有8億訓練參數和20億訓練參數兩個版本,可以實現以文生圖、視頻剪輯、以圖生圖等功能。
中國聯通負責人也頻頻就大模型行業的進展表態。中國聯通董事長劉烈宏認為,大模型是繼圖形用戶界面和觸屏手機以來,又一次人機交互領域的顛覆性革命,從知識容量和學習速度而言,人類或許比不過AI,但AI的發展離不開人類的智慧,這也是未來科技創新型企業的“必備技能”。
中國聯通國際有限公司董事長兼總經理孟樹森則表示,2023年以ChatGPT為代表的大模型技術進步加快人類社會進入通用人工智能時代。數字科技企業既面臨著三大問題的挑戰,也迎來了全新的發展機遇:第一個層面是支持大模型訓練的大算力需求帶來的挑戰,第二個層面是綠色發展帶來的挑戰,第三個方面是安全可信要求帶來的挑戰。
據悉,中國移動也將于7月8日首次發布“九天”1+N大模型。該大模型為通用智能的“人工智能大平臺”,定位為新型人工智能基礎設施,承載面向國民經濟主體的通用智能大模型、行業大模型等,基于泛在的算網基礎設施,實現數據的高質量利用。
近期,中國移動董事長楊杰表示,隨著海量數據的不斷涌現,面向數據感知、傳送、存儲、處理全環節提供一體化支撐服務,已成為全社會的普遍需求,特別是當前AI大模型的興起,進一步激發了對高價值數據、高性能算力、高標準算法的迫切需求,推動信息基礎設施和信息服務體系向連接、算力、能力深度融合的方向加速演進。
關鍵詞: