撰文|懂懂??????
編輯 | 秦言
【資料圖】
出品|懂懂筆記2018 年我們用手機刷著抖音的時候,絕對想不到短短幾年時間,視頻會發展如此之快,在我們的生活、工作中已經無處不在。
購物都是看直播,春晚可以邊看邊“玩”,在線教育上大課、小課都很輕松,身處異地也可以多人連線K歌……
作為一個普通的用戶,這幾年可以感受到視頻的快速發展,以前很多不能實現的場景,慢慢來到我們的生活中,甚至很多超出想象的場景,也在不斷被制造出來。生活、工作的方式,正在逐漸被視頻所改變。
前臺的內容越精彩、形態越豐富,后臺就需要越強大的技術支撐。當“行業+視頻”成為新常態,視頻云也正在成為智能社會的新基建。
抖音用戶的流暢體驗,背后是億級DAU打磨的火山引擎視頻云。一方面其技術能力快速成長,滿足平臺不斷創新應用的需求,另一方面其也在將這種行業領先的能力外溢,幫助更多的企業、行業創新。
“當下,視頻化是數字時代的重要特征,正在為全行業輸出商業創新與變革的源動力,重塑工作模式與商業邏輯。”火山引擎總裁譚待在火山引擎視頻云&AIGC技術大會表示。
「01」
超視頻時代:助力千行百業體驗創新
不知不覺,你發現在萬物互融時代,人人看視頻,人人發視頻,萬物皆可拍,萬物皆可播,正在進入超視頻時代,視頻對社會的影響在不斷加深,正在改變人們生活、工作的方式。過去幾年,在C端應用中視頻已經幾乎成為了標配,手機中的社交、資訊、電商、音樂等各類應用都開始增加不同形式的視頻功能,因視頻的直觀、生動、豐富,已經成為增強用戶粘性的必要手段。據統計,TOP100 APP中搭載了點播、直播或實時音視頻功能的比例高達69%。
如今,視頻化的趨勢已經蔓延到B端。無論是從行業競爭,還是從用戶體驗來看,每一個行業、每一個企業都有迫切創新的需求。人們常說,AI把每一個行業重新做一遍,事實上視頻也正在催生這種變化,把每個行業都重新做一遍。因為視頻,一些行業的運行模式在發生變化,用戶的使用方式也在隨之而變。
2022年中國視頻直播帶貨規模約3.5萬億元,在整個網上零售額中占比達到25.4%。每一個品牌、商家都將直播帶貨視為重要的營銷手段,看直播也成為消費者購買決策的重要渠道。
旅游行業,短視頻、直播帶火了多個城市、無數個景點。到網紅景點打卡已經成為人們出游的必選項。當然,如果不方便出行,也可以通過3D沉浸式體驗“逛”景區。字節跳動與火山引擎視頻云聯合中國第一歷史檔案館、敦煌研究院、甘肅簡牘博物館、國家圖書館(國家典籍博物館)打造了VR《古籍尋游記》項目,依托三維重建技術,我們可以通過Pico、抖音裸眼VR等方式,用戶不僅可以穿越空間,還可以穿越時間,親自“參與”歷史事件。
教育是非常大的市場,除了K12,還有各種興趣培訓、職業教育、知識傳播等等。權威投資機構報告顯示,素質教育、職業教育等互動直播增長勢頭強勁,知識傳遞的方式也因為視頻化有所突破。今天,不僅學生對線上課堂習以為常,用戶接觸、學習知識的方式也更靈活多樣,刷短視頻快速了解一個知識點,看直播了解投資理財知識,在線學畫畫、刺繡,跟著直播練瑜伽。
疫情加速了在線會議的發展進程。中國云視頻會議市場從2021年的37億持續增加到2022年的43億,打破空間限制,極大提升辦公效率,商業傳遞方式在也發生改變。疫情雖然過去,但是這種先進的生產方式被固化了下來。
很明顯的一個趨勢是,視頻化呈現出從游戲、電商、社交等消費互聯網,向醫療、金融、教育、汽車等行業互聯網滲透的趨勢,視頻應用轉向產業互聯網領域,創新出各行各業場景化的視頻智能應用。
一個新的挑戰擺在企業面前:如何抓住視頻化的機遇,創新業務模式,進行數智化升級?在超視頻時代業務融合、體驗需求、快速創新的趨勢下,視頻云正在成為智能社會的新基建。與視頻快速發展相匹配的是,近兩年視頻云的技術在快速迭代,市場規模也在快速擴張。
「02」
體驗倒逼技術:前臺越豐富,后臺越強大當下,一方面行業創新應用非常迫切,另一方面用戶的體驗需要不斷提升。千行百行都希望通過快速創新,找到未來突破的方向。
比如,春晚寄托著每一位華人的各種情結,辦好春晚不僅要在節目上創新,還要在形式上創新。抖音通過網絡直播春晚,觀看人數破1.3億,并且每一個人看到的都是高清、絲滑、低延時的內容。通過網絡,用戶不僅看,還可以“玩”,搶紅包,聊天,送祝福,邀請好友一起看,在看春晚的同時通過互動增進了親情,也讓喜慶的氛圍更濃郁。
火山引擎視頻云與千行百業的客戶一起做著類似春晚創新這樣的探索。娛樂場景的多人互動大合唱方案,讓傳統綜藝增加了參與感,煥發新活力;營銷場景的互動直播,有效的提升了用戶消費轉化;虛擬直播間讓品牌和商家可以24小時無休地賣貨,永不關門的店鋪;VR云制播方案為新品發布會、賽事直播和文旅直播等行業帶來了新體驗。
前臺業務越豐富,就需要后臺的支撐越強大,體驗倒逼技術進步。作為智能社會的新基建,視頻云效率提升是依賴全鏈路的技術提升,包括底層需要芯片、云計算、數據庫、人工智能等融合支撐。
為了滿足新需求,火山引擎通過技術創新努力突破三個邊界:算力邊界,大規模視頻數據與技術迭代速度不匹配;效能邊界,視頻應用普及與落地接入效率不匹配;融合邊界,行業深入滲透與場景需求碎片不匹配。
在超視頻時代,企業端不僅要更快速地創新,并且是跨業務、跨平臺融合,在用戶端需要極致的體驗,比如高清、低延時,這都對計算性能和異構計算資源的運用提出更多的要求,同時也需要一個能夠應對快節奏的視頻處理框架,幫助客戶把各種創新快速落地。
面對復雜的需求,火山引擎基于抖音集團大規模應用實踐和打磨,實現了從通用計算到異構計算的躍進,建立起異構計算的大底座。
ASIC算力是未來的重點方向,火山引擎在這一次的峰會上帶來了自研視頻編解碼芯片,其一臺芯片服務器的轉碼能力相當于百臺CPU服務器的算力;同時火山引擎自研視頻編碼芯片的壓縮效率也相當優秀,比行業主流硬件編碼器提升30%+,可以使單個視頻的計算、存儲和傳輸的邊際成本達到平衡。這一芯片在視頻直播、超低延時、視頻點播、VR直播/點播、圖片轉碼等場景帶來明顯的提升。
FPGA算力相比ASIC密度、吞吐稍差,但是具有可擦寫、更靈活的優勢,也是當下算力必不可缺的一部分。火山引擎通過技術優化,FPGA編碼器整體編碼性能比行業標準編碼器提升了30%。該編碼器也在2023 MSU賽事中獲得最佳4K FPGA編碼器稱號。
首次推出了火山引擎自研ARM陣列服務器,把編轉碼內核在ARM指令集上深度集成和優化之后,經過大規模實測發現這種算力資源在密度、成本方面相較x86服務器有很大優勢。
異構計算、擴展協同、復雜場景對框架提出了更為苛刻的要求,基于億級DAU實踐下,火山引擎帶來了通用且易用的下一代視頻處理架構BMF。開發超分模塊,基于原有架構大約占用2周的時間,基于BMF,開發者只需1周即可完成上線。在這個更先進的架構上,企業的互動娛樂場景、直播營銷場景、虛擬直播間等方案都可以更快速地落地。
火山引擎視頻云是在抖音的實踐中成長起來的,隨著千行百業對視頻需要的增加,火山引擎視頻云將能力向各行各業輸出。技術的價值體現在對業務的賦能上,為了更好地幫助開發者、幫助企業創新,BMF以開源的姿態示人,用一種普惠的方式加速視頻化的進程。
「03」
AI落地:為視頻創作注入新價值
技術的終極目的是為了業務創新,創造新的業務價值,進而提升用戶體驗,所以應用落地是關鍵。
落地,從場景出發,AIGC是最好的一個注腳。
近日,火山引擎聯合抖音對100部香港經典老電影進行4K修復消息刷爆了朋友圈。一是行業內人士非常興奮,二是每一個熱愛電影的用戶也都非常興奮。賦予老電影二次生命,這就是技術對藝術的增值。
今年隨著生成式AI的大火,虛擬主播成為一種流行。國信證券與火山引擎合作了AI虛擬人直播,以吉祥物陽陽為原型,采用火山引擎提供的AIGC技術,圍繞投資者關心的內容自動生成AI短視頻,由3D虛擬人擔任主播進行全天候的投資咨詢和行情解讀服務。通過AIGC技術,實時讀取行業板塊、大盤指數和資訊熱點,結合自研的數據視頻自動渲染合成動畫特效技術,實現直播視頻的自動定時生成內容。此外,通過一些預設的模板,直播間會有數據圖表、動畫特效、自動字幕等形式幫助用戶提升觀感。
不僅如此,AIGC還給虛擬主播賦予更多人格,設計了27款表情和動作,并全方位覆蓋和還原了行情播報場景所需的動作和表情庫。3D虛擬人主播可實現高精度的唇形及表情驅動,能預測并控制音色的重音、停頓,賦予音色多樣的語氣,演繹出更加真實生動的播報效果。
ChatGPT帶火了大模型,AIGC是最快落地的一個場景。今天,已經到了人人都是創作者的時代。不僅每個人都喜歡隨手拍、隨手發,企業的內容創作也大爆發,比如一個車企,不僅有官方的APP內容,還有視頻平臺的內容,矩陣號,員工號,經銷商號,企業內宣,等等。
內容無處不在,從拉新、促活、轉化的維度為企業創造著更大的增量。
抖音商家通過精彩的短視頻或是生動的直播實現拉新,汽車之家通過內容社區互動不斷沉淀更多的新用戶;金融行業數字人直播通過內容促活,激發業務增長;自如通過VR看房提升效率的同時,也大大增加了轉化率。
內容的爆發,對創作工具有了更高的要求:自動生成內容,無需人工剪輯,激發更多創意,批量生產,多個帳號運營……為了幫助企業高效生產內容,火山引擎智能創作云為企業提供體系化的內容生產工具,涵蓋從創意策劃、內容制作、內容管理、內容發布、數據反饋的創作全流程。
今天人們都在討論大模型的時候,火山引擎已經逐步讓AI在內容生產的全流程落地,AIGC可以實現腳本撰寫、改寫、擴寫,數字人分身技術可以讓每一個員工都有一個數字備份,AI可以快速制作海報,視頻的自動生成,通過文字自動生成圖片,這些AI工具大大地解放了生產力,讓企業有了更大膽的創新空間。
相信很快,在火山引擎視頻云的支持下,更多的行業創新將涌現出來。
【結束語】
譚待表示:“在新基石的技術演進過程中,我們面臨三大邊界限制:首先,一面是更高清、更交互、更沉浸的視頻體驗成為用戶需求常態,而另一面是技術突破天花板見頂,導致我們面臨技術的邊界限制;其次,當視頻化已經成為應用標配,一面是快速試錯驗證模式,而另一面是應用接入復雜度高,導致我們面臨效率的邊界限制;最后,隨著視頻化在細分行業不斷滲透,一方面視頻場景需求碎片,而另一面是行業方案場景化能力弱,形成行業融合的邊界限制。”
作為新基石的代表,火山引擎視頻云不斷努力,從底層技術創新、開放架構、場景落地等維度,全方面助力行業創新,實現科技帶來的增量空間。在視頻把每個行業重新做一遍的過程中,火山引擎視頻云成為必不可少的一個角色。
關鍵詞: