在ChatGPT的熱潮下,大模型五花八門,層出不窮,讓人目不暇接。
近日,科大訊飛也宣布即將在5月6日發布訊飛星火認知大模型。盡管大家可能已經審美疲勞,但科大訊飛的大模型,依然是有值得注意、顯而易見、卻常常被人們忽視的特別之處——
盡管各行各業、各個大廠都在推出類ChatGPT大模型(或是通用的,或是垂直的),但作為榜樣的ChatGPT本身是OpenAI在網頁上推出NLP的模型。NLP,全稱Natural Language Processing,也就是自然語言處理。在這一技術上,科大訊飛無疑是該領域的領跑者。
(相關資料圖)
“百模大戰”中難免泥沙俱下,但有一點是比較肯定的——從大模型的發展特點來看,新選手想要突圍十分不易。
大模型并非空中樓閣
想要打造一個中國版ChatGPT,必須是建立在大模型的基礎上。ChatGPT證明了在某種程度上,大模型擁有比小模型更優的效果。
過去AI公司囿于種種條件制約,基本都以小模型為主。如今這些公司確實要紛紛從小模型遷移大模型,但這不是一個從零開始的過程。
與小模型類似,AI大模型的核心要素在于數據、算法和算力,因此從小模型到大模型很多東西是通用的。
在數據領域,以ChatGPT為例,數據來源主要是互聯網上的大量文本數據,以及各種知識庫和語料庫。一個優秀的中文NLP模型在獲取數據的難度上還要超過ChatGPT,因為中文數據在互聯網的開源程度較低,高質量無監督語料嚴重不足。而類ChatGPT大模型本質是基于有限語料范圍的概率歸納模型,語料質量不高可能會導致大模型頻繁“失靈”。
但幸運的是,小模型的數據集可以完全遷移至大模型使用,這使得在AI 1.0時代積累起來的數據優勢可以延續。科大訊飛近日接受機構調研時表示,在嚴格遵守適用法律法規前提下,訊飛在多年認知智能系統研發推廣中積累了超過50TB的行業語料和每天超10億人次用戶交互的活躍應用。科大訊飛在語音方面的主流市場占有六七成的市場份額,這無疑形成了訊飛大模型的優勢。除了擁有海量的中文數據,科大訊飛通過深耕垂直領域還掌握了醫療、教育等專業數據端口的數據。
在算法領域,大模型和小模型也不是完全割裂的。不僅是大模型可以通過量化、剪枝、知識蒸餾等模型壓縮方法生成小模型,優秀的小模型可以“反向蒸餾”、有效引導大模型的生成。這比從0開始構建大模型的可操作性強得多。
算力優勢能遷移到大模型之上,這一點相信十分容易理解。以科大訊飛為例,公司于2009年開始算力基礎設施建設,在總部自建有業界一流的數據中心,目前已建成4城7中心深度學習計算平臺,在自用以外還面向平臺數百萬開發者和其他行業伙伴開放。尤其在當前美國卡脖子AI芯片的重要關口,這個優勢在中國市場更凸顯了重要性。尤其值得注意的是,超級算力中心建設資金門檻在ChatGPT出現后,已經推向百億之上(在微軟的支持下),而運營與維護成本更是天文數字。基于優質數據卡位,算法能力和商業化策略,科大訊飛在算力維度可以通過推動企業間的分布式計算協作,提升算力的效率、降低成本。
這些都是后來者遠難以彎道超車趕上的。正如科大訊飛管理層在業績會上說:“(這)是吃第十個包子,厚積薄發的一個事情。”
但NLP大模型卻又并非新瓶裝舊酒。過去的NLP領域有著非常顯著的技術瓶頸,引用科大訊飛管理層的原話“瓶頸不在語音轉文字,而在語義理解。”不同于機器視覺識別技術已經相當成熟甚至進入紅海階段,“語義理解”一直是全球AI難以翻越的一座大山,直到ChatGPT翻越了這座大山。
盡管我們要承認中國人工智能在這個領域稍許落后,但也要看到機會。就像某新財富分析師曾提到,就像特斯拉車沒出來之前,蔚來和小鵬這些東西都沒搞出來,但特斯拉車搞出來后,我們國家大量的新能源車廠像雨后春筍一樣出現。
科大訊飛管理層表示,現在機會真正來了,技術會突破臨界點,到達一個真正能商業化落地應用的階段。
進入規模化的新階段
在一片流血上市的人工智能公司里,科大訊飛的盈利能力獨樹一幟,恐怕已是人工智能公司之最,在整個A股市場中也擔當得起“成長長青”這四個字。科大訊飛是過去10年來唯一連續10年營收年增長率均超25%的A股上市公司。
盡管如此,我們卻依然能常常看到它的盈利能力受到詬病。這與科技公司的屬性有關,由于高研發投入和定制化成本,所以在滲透率不足、規模化速度不高的情況下,盈利能力會承壓。尤其在2022年科大訊飛在加大投入的同時,疫情導致項目收入確認延期,國際環境使得供應鏈調整進一步延遲項目。三重因素疊加,科大訊飛超30億的合同延期到2023年,因此收入和支出形成“剪刀差”,短期的賬面盈利能力向下。
但進入2023年第二季度,除了業務進度恢復常態,規模化帶來的盈利彈性更值得期待。科大訊飛在業績會表示,從2023年開始,要開啟年利潤增長30%的新階段。
由于小模型的通用性較低,導致定制化屬性較強。但大模型通過"大規模預訓練+微調"的新范式,擁有了較強的通用性,這使得快速規模化落地成為可能。大模型作為解決AI應用碎片化的新開發范式,將帶來了比傳統AI更高的ROI。
事實上,過去傳統AI時代的有效供給不充足制約了滲透速度,但事實上整體智能語音市場的需求很旺盛。從科大訊飛的財報也能看到這點。盡管受宏觀因素影響,2022年公司可持續型“根據地業務”在2022年仍實現23%的增長,抵消了大項目延期所產生的影響,并推動公司的整體營收逆勢中保持穩中有升。
具體地看,“根據地業務”中多個應用場景的前景十分明朗。2022年,科大訊飛的教育考試業務新增12個地市中考和2個省市高考,個性化學習手冊新增300所運營校,學習機流水型線下門店新增769家,“雙減”校內課后服務合作平臺新增130個市區縣,智慧醫療新開拓96個區縣,智慧汽車新增合作車型110個。根據財報,以上業務拓展將在2023年才開始產生持續型收入。
大模型有望成為科大訊飛加速深耕這些應用場景的發動機,科大訊飛于2022年12月啟動生成式預訓練大模型“1+N”任務攻關,其中“1”是通用認知智能大模型算法研發及高效訓練底座平臺,“N”是應用于教育、醫療、人機交互、辦公等多個領域的專用大模型版本,例如,通過學習海量醫學教材、論文和病例,實現專業的醫療領域對話式AI系統,打造“每個醫生的AI診療助理,每個人的AI健康助手”。“1+N”模式使得低成本、高效率的規模化成為可能。科大訊飛管理層在業績會披露了未來目標,包括運營型的根據地業務和可持續流水型業務,5年內占比要超過80%;三年內人均效益能翻番,現金流要匹配利潤增長,最終實現同步良性增長。
像科大訊飛這般在中國既能服務企業又能服務用戶的科技公司屈指可數。隨著開啟AI開發新模式,科大訊飛有望進入大規模落地應用關鍵期,在B端和C端走出新天地。
關鍵詞: