昨天下午,還是那襲紅衣,360集團創始人周鴻祎又帶著驚喜來了----智腦大模型4.0版發布會如期召開。
(資料圖)
這距離3.0版的發布也就13天,離2.0版也就26天,也就是說不到一個月就連發兩版,先不說其他,光這“成長”速度就不得不令人咂舌。
當然,國內大模型這種“你追我趕”的勢頭,有利于我國大模型能力的快速提升乃至相關產業鏈,形成更濃烈的創新環境和氛圍,對用戶和中小企業們等參與者未嘗不是一件好事。
可能是有了前幾次的經驗,再加上權威評測數據的鋪墊,市場對于此次發布會的期待亦可見一斑---三六零于昨日早盤迅速拉漲,直逼漲停,并帶動一眾大模型概念股集體飄紅。
事實上,360的這場發布會全場看下來,也算是不負眾望---干貨滿滿、金句不斷,甚至不乏一些驚艷之舉。
大體而言,本場發布會的核心或者說重頭戲可以歸結為三件事:展示4.0版的多模態能力、360全系產品接入、重新定義數字人。
1
展現多模態交互能力
在周鴻祎看來,國內大模型的基礎能力基本處于同一起跑線上,但迭代速度已經接近國際平均水平,要想“彎道超車”關鍵還需在多模態領域發力。
“未來大模型的能力是多模態能力的競爭,只有多模態的全面能力,才能標志著大模型真正地邁上一個新的臺階。”他認為。
360于2015年成立AI研究院,2018年開始發力多模態。如今的360智腦4.0已具備跨模態生成能力,包括文字處理能力、圖像處理能力、語音處理能力、視頻處理能力。具體可實現圖生圖、文生文、圖生文、文生圖、視頻生文、文生視頻等,并在現場得到了逐一演示。
1)文生圖:生成“熊貓爬長城”
2)圖生圖:例如身份證生成證件照、證件照換背景;
3)圖生文:根據圖片描述、判斷圖片不合理的地方
4)視頻理解:檢測視頻中的車輛、廣告牌、檢測高層建筑等物體,可增加不同的前綴
5)文生視頻:例如熊貓劃船等
其中,此次360智腦“文生視頻”多模態功能乃是國內首發,任何文字腳本都可生成視頻,不受素材限制,國外現在也只能生成10s的視頻。
未來的通用智能一定是多模態智能,這點在業內基本已成共識。相比大語言模型,多模態AI在技術上遠未收斂,無論在科研、工程還是應用層面,都是一片廣闊天地,大有可為。
如果說GPT等大語言模型開啟了應用創新的新時代,那么多模態AI將會把這一輪應用創新推到最高潮。
但是多模態AI的難度也是可想而知的。例如,文生圖這樣最基礎的跨模態任務,或許今天許多人認為已經完美解決。Stable Diffusion + ControlNet + LoRA的組合看上去無懈可擊,Midjourney工具用起來也似乎得心應手。
但真實情況是,基于擴散模型的文生圖算法在娛樂和大眾傳播領域非常受歡迎,但想融入專業制作流程或取代職業美術師,還是有相當的難度。
文生圖尚且如此,那文生視頻、文生3D、文生動畫,圖文混合邏輯推理等更難的任務,今天確實還處在非常早期的階段。
事實上,大模型本身已具備多模態能力。通過大模型學習多模態知識,來加速多模態AI的開發與應用被業內視為一條值得探索的路徑。至少,目前360又讓我們又看到了這樣的希望。
2
重新定義數字人
在周鴻祎看來,僅靠大模型基礎功能的發展,并不能帶來工業和產業革命,關鍵還需要實現與更多場景結合、走向應用。
其中,360基于大模型“激活”的AI數字人,并提出“有靈魂的數字人”的概念,不論是其構想還是現場演示情況,絕對都稱得上是驚艷了。
為什么選擇數字人領域?
他認為,數字人是未來人工智能大模型最重要的應用入口。而沒有大模型支撐的傳統數字人只能按既定腳本輸出內容,不能交流,且沒有性格和記憶。
所以,按其計劃,360將依托360智腦大模型能力,打造有記憶、有人設和性格,能夠復刻思維方經歷的AI數字人,重新定義“數字人”。
另外,由于數字人多多應用于虛擬偶像,使得數字人應用場景受限,多應用于泛娛樂場景。對此,360AI數字人給出了一個更優解,將打開當前數字人應用的想象空間。
360推出了一個“數字人廣場”的平臺,目前擁有200多個角色,分為數字名人和數字員工兩類。
其中,數字名人包括歷史人物、偶像明星、文學形象等,讓用戶在與數字人的開放對話中實現與偶像的近距離接觸,與先賢的思想交流;數字員工能夠參與創作、策劃、分析、總結日常工作,成為企業員工的知識助手和辦公助手,從而提升企業運營效能。
與此同時,周鴻祎現場演示了“法務專員”數字人角色,對中小企業常見的公章管理和合同審核問題給與了專業回答。
特別是數字員工的出現,打開了市場對于數字人應用場景的想象空間,拓展了數字人應用的可觸及邊界。
此外,360AI數字人還支持定制,每個人都能通過上傳私人知識庫,低成本生成自己的專屬數字人,如數字分身、數字助理、數字偶像等。
事實上,數字人產業自2010年發展至今,已經有很長一段時間了。但AI數字人發展尚處早期水平,未來成長潛力可想而知。
根據IDC的預測,中國AI數字人行業即將在2023-2026年進入規模增長最快的時期,并且2023年作為大模型爆發的“元年”,在AI大模型的加持下,數字人市場步入高速發展期基本是可以預見的。
當然,目前數字人企業入局者甚多,不僅有互聯網巨頭,也有初創公司。而隨著而隨著上游技術和中游服務日益成熟,數字人的創造和應用門檻隨之變低,導致了虛擬數字人“放量”,競爭加劇,即使是高端超寫實虛擬數字人也出現了激烈的競爭。
針對數字人產品普遍同質化的困境,創造更優質的產品應為破局的可行之道,這與360AI數字人的思路可謂是不謀而合。
據市場人士分析認為,360AI數字人打破了傳統數字人的定義和生產方式,打造的是完全具有自主交互能力的數字人,完全不需要人工進行干預,將重新定義“數字人”的概念。
從發展階段來看,IDC指出目前數字人多處在L1-L3階段,未來將逐步過渡到L4-L5階段的純AI驅動階段。其中,L1-L3階段的數字人生產包括簡單的人物形象,依賴外部設備采集人體特征信息,再到依靠算法驅動肢體動作等等,之后更多在交互上實現突破,而L3階段也只限于文本和圖片的簡單交互方式。
但以360AI數字人的底層邏輯和所展現的能力來看,其已開始躍進到L4-L5階段,即純AI驅動,并且表現出不需要人工控制的高智能化水平,完全由數字人自主進行決策以及執行任務,同時在交互方式上也有新的突破,實現流暢的語音化實時交互,這是目前數字人行業中極少有公司能夠做到的。
鑒于上述,360依托大模型創新的極具特色的AI數字人,將在“百舸爭流”的數字人市場占得先機,并有望憑借顯著的稀缺性,快速搶占市場,同時也可在該細分領域掌握一定的AI話語權。
當然,目前360AI數字人應用也并不能說是盡善盡美的。周鴻祎也坦言,目前唯一的問題是回答不穩定,所以還需要提高,未來數字人也還會繼續迭代。
歸根結底,360AI數字人得益于背后“360智腦4.0”強大的多模態能力支撐。
不可否認,多模態AI的技術挑戰真實存在,但有挑戰就意味著有機會。通過技術突破、技術創新在多模態AI領域大步前進,目前正是最好的時機。
3
360大模型戰略:兩翼齊飛,四路并發
周鴻祎將360的大模型戰略概括為“兩翼齊飛+四路并發”。
其中,“兩翼齊飛”指一手抓核心技術研發,另一手抓優勢場景落地。
而“四路并發”則指在用戶端,將360GPT的產品矩陣“360智腦”與搜索場景結合,推出新一代智能搜索引擎,現已定向邀約企業客戶測試,未來還將推出AI瀏覽器、AI個人助理等產品;在中小企業端,將推出結合“360智腦”能力的SaaS化垂直應用;在政府及企業端,將開拓私有化大模型藍海市場,為城市及企業打造定制化的GPT;在安全領域,將核心的安全能力與GPT結合,推出360GPT安全應用框架。
來源:公開信息
目前來看,隨著360智腦快速迭代及AI數字人的推出,說明360已完成從戰略規劃到大模型基礎能力擴展再到應用實踐的打通,360大模型的“羽翼”也迅速豐滿起來。當然,這一過程其實正應合了周鴻祎所指出的“大模型的價值在于將其能力通用化、垂直化,與具體的業務需求深度融合。”
據了解,在經過多輪迭代之后,360智腦目前已具備生成與創作、多輪對話、代碼能力、文本分類、文本改寫、閱讀理解、邏輯與推理、知識問答、多模態、翻譯等十大核心能力,維度涵蓋數百項細分功能,可覆蓋大模型全部應用場景,并在多個第三方評測中位居國產大模型第一梯隊。
他認為,中國進入“百模大戰”,基礎能力外,更重要的是應用場景的比拼。所以,也有了會上他宣布“360智腦4.0”接入瀏覽器、搜索、安全衛士等360全端產品,實現全面智能化重塑,也標志著360進入全AI驅動的智能化新時代。
由于搜索引擎的大數據源是構建類ChatGPT產品的核心抓手,不僅有豐富的網頁數據和優質的語料庫,而且有基于每日用戶行為的迭代模型,決定了在大模型國產化背景下的像360這樣的國內頭部搜索引擎廠商的天然優勢,從而獲多家券商看好。
會上周鴻祎也表示,360大模型研發落地擁有“八大天然優勢”,包括技術、算力、場景、大模型安全、搜索增強、內容安全、數據、工程化,完整覆蓋大模型訓練全程。
另外,他也預告,下個月會發布5.0插件版本,使得大模型“有手有腳”。屆時360又會帶來什么樣的驚喜?是不是已有些迫不及待了。
關鍵詞: