文心一言的發布會定檔3月16日,不出意外,百度創始人李彥宏、CTO王海峰將出現在北京總部的發布會現場。這是百度版ChatGPT最新的官方消息,2月7日,文心一言首次官宣,當時稱,產品“3月見”。
3月如期而至,距離發布會還剩10天,各種消息烘托出期待:3月16日用戶就能用上文心一言了。有心人也在圍觀,文心一言面世后能否達到ChatGPT的能力。
【資料圖】
這個結果恐怕要等到文心一言產品正式向公眾開放后才能評估,而《元宇宙日爆》從內部獲悉,3月16日當日,公眾還無法直接使用文心一言,“內測及可能的公測”之后產品才會直達用戶。畢竟,谷歌、微軟的同類產品翻車在前,百度有前車之鑒,以多測確保重點產品的穩妥。
文心一言長什么樣?百度內部密不透風,些許信號透露,搜索引擎大概率是百度版ChatGPT最主要應用方向,“云輸出"文心一言的AI能力也是百度會涉及的業務。
這些信號有文心一言底層“文心大模型”的過往應用方向可印證,而當微軟將ChatGPT的模型GPT3.5語言整合進Azure的云服務后,上崗7年多的百度智能云自然會順勢“一言”。
01 產品封閉開發 測后才示眾
一個大概率的事件是,文心一言最終以產品的形態供大眾用戶使用,要等到測試之后了,測試很可能會在3月16日之后,百度內部人士的說法是,“先內測,可能還有公測”。
公開消息可見,內測用戶為百度文心一言的首批生態合作伙伴,主要以企事業單位為主,其中媒體機構最為龐大,包括上海報業集團旗下的澎湃新聞、四川日報報業集團下的封面新聞等超過超過160家媒體將成為百度版ChatGPT最先“嘗鮮”的一批用戶。
“輸入文字、獲得回答”的ChatGPT已經展現了文本對話型AI機器人對自然語言理解能力的提升,天天和文字打交道的媒體自然展現出對文心一言的剛需。
內測之后,可能還有公測,測試不斷,足見百度對推出“國產ChatGPT”所持的謹慎且重視的態度。畢竟,谷歌和微軟在搶占“對話機器人”的先機時都先后翻了車。
2月10日,在巴黎的一場活動上,谷歌展示Bard“如何向9歲小孩介紹詹姆斯·韋伯空間望遠鏡(JWST)的成果”時,這個機器人將2004年智利的甚大射電望遠鏡(VLA)的重要成果安在JWST頭上,“張冠李戴”的錯誤結果被網友指摘不說,展示活動當天,谷歌股價下跌超7%,創下去年10月26日以來的最大日跌幅,谷歌市值瞬間蒸發1000億美元。
“一本正經地胡說八道”也是ChatGPT存在的問題,而微軟將該機器人的底層模型引入搜索引擎必應(Bing)后,不只會出現錯誤知識,甚至還出現了“倫理問題”。有獲得體驗權限的網友曬出長時間與Bing的機器人聊天稱,該搜索引擎彈出了要和提問者“戀愛”甚至“勸離婚”的內容;還有記者反饋,他指出Bing機器人的錯誤后,遭遇了它的嘲諷,后來被不認錯的Bing以“你沒有好好使用我”指責了。
這兩大互聯網巨頭的對話機器人亮相后,中國市場自然會將目光投向百度的文心一言,拿來比較、體驗是一定會出現的。如此矚目,百度要“測了再測”也就不難理解了。
至于文心一言到底長什么樣,百度的內部人士稱,產品一直處于封閉研發中,“估計只有李彥宏和王海峰知道了,但兩人會在發布會上說什么,也沒人知道。”3月16日,也就再等10天,答案將揭曉。
百度內部對文心一言的產品終態密不透風,倒是這類文本生成式的產品,百度有不少,最值得注意的是2021年年底發布的百億級“知識增強大模型”文心ERNIE3.0。
飛槳社區成員放出的ERNIE3.0模型功能
有程序員在百度的飛槳社區中放出過ERNIE3.0在“文本理解與創作”上的效果,截圖顯示,該模型可實現同義改寫、寫作文、對對聯、寫小說、補全文本等功能,其中也支持自由問答,輸入問題后,點擊立即生成,就會獲得AI的答案。
《元宇宙日爆》發現,現在在文心大模型官網上,如果你在“開放API”欄目中點擊“ERNIE3.0文本理解與創作”選項時,直接彈出的是文心一言的官宣預告。這或許暗示著,ERNIE3.0身上的本事很可能將在文心一言中展現,雙方的關系類似GPT-3模型與ChatGPT。
02 大模型露玄機 “搜索+云”追微軟
ERNIE3.0模型的存在至少證明了百度在對話機器人上已有技術積累。
如果類比的話,百度的ERNIE文心大模型類似于Open AI的GPT模型,于2019年推出,從單一的自然語言理解延申到多模態,包括視覺、文檔、文圖、語音等,不斷迭代到了3.0。
文心一言和去年8月推出的AI生圖應用“文心一格”一樣,名字部分直取于文心大模型,那么基于ERNIE系列,文心一言就可以在這個模型上進行泛化和性能調整。ERNIE 3.0的文本理解與創作能力也說明了這一點。按百度內部人士的說法,文心一言不是什么新鮮物種,是大模型基礎上的迭代。
那么,脫胎于文心大模型的文心一言,到底是網頁版的ChatGPT還是搜索引擎式的新Bing?
更大的概率會集成進搜索引擎中。
一方面,百度最為人知的產品是國人天天都要“百度一下”的搜素引擎,同類競品中,谷歌、微軟這兩大巨額投入AI的公司也最先將對話機器人的模型和技術嵌入到搜索中。
此外,生成式AI和搜索引擎在技術上本身“很搭”。今年1月,百度Create AI開發者大會前夕,李彥宏表態,將基于百度自研的生成式模型升級為“生成式搜索”,“生成式AI和搜索引擎是互補關系而不是替代。”
將文心一言引入搜索引擎,對百度的大模型也有好處。要知道,ChatGPT預訓練大模型的語料數據主要來自互聯網的文本數據庫,包括從網絡文本、維基百科、文章中獲取的高達570GB的數據。那么,文心一言如果接入百度搜索引擎,與用戶的交互和聊天將為文心大模型提供更具數量級的自然語言模型的訓練數據,這些大規模結構化、非結構化的數據將為中文版的ChatGPT提供更充分的預訓練語料。
文心大模型諸多產品化
綜合分析,文心一言接入百度搜索的可行性很高。而除了搜索,這個Bot可嵌入的另外一塊百度基建是“云”。
ChatGPT爆火后,微軟幾乎將全線產品都加上了OpenAI研發的GPT 3.5模型,除了Bing和Office外,Azure云服務是其中的重頭戲,微軟試圖通過Azure+GPT3.5的方式對外輸出AI基礎設施、模型和工具鏈,服務于想要構建應用程序的第三方。
如果說“文心一言+搜索”是面向C端的產品,那么“文心一言+云”會直取B端,這意味著商業化。
在云市場上,百度智能云已經上崗7年,在AI高需求的算法、算力上均有布局,比如位于陽泉、定興、徐水的三個云計算中心,這些基建的存在十分必要,畢竟,國產版ChatGPT上線后,首先得“不崩”。應對有高并發需求的產品,ERNIE大模型將再次驗證百度云高并發、高彈性、高精度的能力。
反觀AI,百度也極其擅長將大模型的能力產品和場景化,光文心大模型,就整合出適配醫療、金融等各種具體場景的子模型,去年還搞了AI生圖的文心一格。
文心一言首批生態合作伙伴已是企業云集,百度要“交朋友”,各家公司也不吝惜友情。百度內部人士透露,每天都會收到“求內測”的企業客戶。ChatGPT這口鮮貨,無論是主營線上業務的互聯網公司,還是主打線下場景的傳統企業,都躍躍欲試。海外跨境調用難,百度國產自然成了香餑餑。
C端有搜索引擎,B端有云服務,文心一言能整合的百度產品不少。發布會在即,測試將近,這個“本地媳婦”是丑是俊、能否和“外來媳婦”一拼,3月16日之后將見分曉。
責任編輯:房家輝
分享到:版權聲明:凡注明來源“流媒體網”的文章,版權均屬流媒體網所有,轉載需注明出處。非本站出處的文章為轉載,觀點供業內參考,不代表本站觀點。文中圖片均來源于網絡收集整理,僅供學習交流,版權歸原作者所有。如涉及侵權,請及時聯系我們刪除!