《生成式人工智能服務管理暫行辦法》近日正式施行。生成式人工智能作為在文本、圖片、音頻、視頻等內容生成領域最先進的技術,該管理辦法的出臺將對廣播電視和網絡視聽產生深遠影響。本文簡要梳理了當前行業中采用生成式人工智能(AIGC)的部分案例,探討AIGC技術在音視頻內容生產、影視創作、虛擬主播、內容審核、智能推薦等領域的潛在發展趨勢。
在這支AI制作的科幻電影預告片《Trailer: Genesis》(《創世紀》)中,從圖像視頻合成、音樂到剪輯均由AI完成,使用的AI工具及用途包括了Midjourney 處理圖像、Runway 處理視頻、Pixabay 處理音樂、CapCut 剪輯視頻等。
(相關資料圖)
AIGC+音視頻生成:
提高內容生產者創作效率
音視頻生成技術在語音合成、智能音樂創作、自動化視頻集錦、視頻拆條、視頻超分、游戲開發和虛擬現實等細分場景中擁有廣泛的應用前景,且高效節省了人力時間成本。
2020年全國兩會期間,人民日報社利用“智能云剪輯師”實現自動匹配字幕、人物實時追蹤、畫面抖動修復、橫屏速轉豎屏等技術操作,快速生成視頻以適應多平臺分發要求。
2022年冬奧會期間,科大訊飛的智能錄音筆通過跨語種語音轉寫2分鐘快速出稿,央視利用AI智能內容生產剪輯系統制作與發布冬奧會冰雪項目的視頻集錦,極大地提高了制作效率,縮短發布周期。
整體來看,視頻生成技術主要是通過大量學習視頻中的空間、序列、時間、場景、物體和動作等信息,自動生成具備真實感和更加多樣化的視頻內容。同時,根據給定的輸入條件,并通過視頻去噪、色彩校正、邊緣增強等后期處理,在保持視頻逼真度的同時實現對生成視頻的精細化控制和細節的修復與優化。
音頻生成主要是利用深度神經網絡模型對大量音頻數據進行訓練學習,自動生成高質量、逼真的多種音頻類型,還可以根據特定場景或需求對生成的音頻進行優化和定制,以滿足不同用戶的需求。
AIGC+虛擬主播:
推動虛實融合多樣化進程
近幾年越來越多的虛擬主播正走向前臺,如總臺的“小小撒”和“AI王冠”,北京臺的“時間小妮”、湖南臺的“小漾”、東方衛視的“申雅”“東方嬡”、浙江衛視的“谷小雨”等等。這些虛擬主播好看的皮囊下,離不開AIGC技術的賦能。通過深度學習算法分析和學習大量人類主播的視頻和音頻數據,AIGC生成具有逼真、自然的語音和動作的虛擬主播。這些虛擬主播可以隨時隨地出現在直播、電視節目等各種形態中,極大地豐富了數字內容的形態和表現方式,為廣播電視和網絡視頻領域注入更多的創意和活力。
多家媒體正在積極布局AI虛擬主播,并將其應用場景從新聞播報擴展至晚會主持、記者報道、天氣預報等更廣泛場景,為全國兩會、冬奧會、冬殘奧會等重大活動深度賦能。
如北京臺的“時間小妮”經過情緒仿真引擎處理,其外貌、語音、口型、肢體動作與真人相似度達到97%,可用于營銷宣傳、新聞報道、教育教學、智能問答等多個領域。2022年兩會期間,百度利用AIGC技術生成虛擬數字人主播“度曉曉”,通過多模態交互技術、3D數字人建模、機器翻譯、語音識別、自然語言理解等技術,能夠快速、準確地播報新聞內容,且具有自主學習能力。
AIGC+影視創作:
賦能高效內容生產
在劇本創作和故事生成階段,AIGC主要運用其文本生成功能,生成具有一定參考價值的劇本段落甚至完整劇本,特別是在情節演進和角色對話生成方面為創作者提供一定便利。越來越多的AI編寫劇本產品已經出現在市場中,如2020年美國學生用OpenAI的大模型GPT-3創作劇本并制作的短片《律師》。目前,搭畫快寫AI、觸站AI、輕微課AI等已經成為編劇領域具有一定代表性的AI輔助創作產品。
在內容創作階段,AIGC可以完成從劇本到分鏡的自動拆解與生成,從而縮短劇集的籌備周期。到畫面生成階段,AIGC可以根據數據和大量訓練,依據給定的文本描述、圖片和視頻等智能地生成包括角色動作、場景布置和特效效果等的畫面。目前Meta AI發布了文本生成視頻的AI系統“Make-A-Video”,Google發布了Imagen Video和Phenaki。
Netflix公開了一部由AI參與制作的動畫片《犬與少年》(The Dog and The Boy),時長3分鐘,由Netflix日本、小冰公司日本分部(rinna)和WIT STUDIO共同創作。這是第一部AIGC技術輔助制作的發行級商業動畫片,其所有動畫場景繪制均由AI生成。在影片結尾,制作團隊展示了AI輔助場景制作的大致過程,可以分為四步:布局、AI生成及進一步生成、成稿。
AIGC+內容審核:
助力審核高效化發展
AIGC技術在視聽內容審核方面發揮著重要作用。例如,通過語音識別和語義理解技術,AIGC技術可以檢測和識別內容中的敏感詞匯和暴力內容,從而對違規內容進行標記和刪除。此外,AIGC技術還能夠通過圖像和視頻分析技術監測、識別和過濾如色情和暴力畫面等不良內容。
騰訊與虎牙共同成立的AI智能審核平臺中,虎牙結合自研“AI智能識別、人工審核和網絡志愿者”三位一體模式,騰訊則全面開放“AI+大數據”內容風控安全技術,共同優化內容識別能力,以應對直播平臺內容風險和威脅,營造更為安全的內容生產環境。
百度提出“AI內容風控”概念,通過應用圖像識別、富媒體識別、NLP、分類/聚類、關聯挖掘、機器學習等技術,對違法違規、垃圾信息、內容質量差等情況進行風控,可實現對多種內容的跨場景判斷,據稱99%的信息在上線前能被自動攔截,減少了大量人工勞動。
然而,AIGC技術仍然無法完全替代人類審查,可能會漏檢或誤判某些內容。比如難以識別復雜的隱喻、諷刺等語言形式,難以理解某些具有特殊含義的圖片、視頻等內容。因此,在實際應用中,需要結合人工審核來提高審核的準確性和可信度。
AIGC+智能推薦:
完善用戶個性化體驗
隨著用戶需求的日益個性化和多樣化,在內容智能推薦領域,AIGC技術同樣蘊藏了諸多可能性。比如,通過對用戶的觀看行為、視頻偏好等數據進行分析,AIGC能建立完整的用戶畫像,智能推薦符合用戶興趣的音視頻內容,還可以生成個性化的新聞播報、廣告宣傳等音視頻內容。
目前,央視視頻、芒果TV、騰訊視頻、愛奇藝、優酷、今日頭條等平臺均結合AIGC技術分析用戶行為和興趣偏好,分析用戶觀看歷史、搜索記錄、點贊、評論等細粒度數據,為用戶提供針對性更強、內容更加精準的視頻推薦。這不但能促進視頻內容的多樣化、個性化,還有助于增強廣播電視和網絡視聽領域的用戶黏性和平臺競爭力。
未來,隨著數據規模快速膨脹、算力性能不斷提升以及人工智能算法不斷發展,AIGC能夠替代內容創作者完成更多內容挖掘、素材查詢調用等基礎性勞動,在視音頻制作、內容審核、個性推薦等方面發揮更大作用。同時,也需要全行業加強多維互動合作、共同研究,推動制定相關的規范、標準和政策,以保證AIGC技術在視聽領域的合法合規合理使用與可持續發展。
(國家廣電總局發展研究中心彭錦、曹思和據公開資料整理)
推薦閱讀:
國家網信辦等七部門聯合公布《生成式人工智能服務管理暫行辦法》
第26屆論道啟動!11月相聚春城昆明,共尋智能視聽新增長。點擊圖片報名參會~
責任編輯:李楠
分享到:版權聲明:凡注明來源“流媒體網”的文章,版權均屬流媒體網所有,轉載需注明出處。非本站出處的文章為轉載,觀點供業內參考,不代表本站觀點。文中圖片均來源于網絡收集整理,僅供學習交流,版權歸原作者所有。如涉及侵權,請及時聯系我們刪除!關鍵詞: