行業主要上市公司:阿里巴巴 ( 09988.HK,BABA.US ) ; 百度 ( 09888.HK,BIDU.US ) ; 騰訊 ( 00700.HK, TCEHY ) ;科大訊飛 ( 002230.SZ ) ;萬興科技 ( 300624.SZ ) ;三六零 ( 601360.SH ) ;昆侖萬維 ( 300418.SZ ) ; 云從科技 ( 688327.SH ) ;拓爾思 ( 300229.SZ ) 等
本文核心數據:場景結構比重 ;
多模態大模型應用場景結構
賽迪四川研究發現,從多模態大模型的應用場景來看,相較語言大模型賦能行業,多模態大模型更加偏重落地場景,商業變現路徑更加清晰。多模態大模型企業 20 強中,應用場景可劃分為 11 類,成熟度相對較高且最受關注的前 5 個場景分別為數字人、游戲、廣告商拍、社交媒體和智能營銷。
多模態大模型讓數字人呈現更逼真
多模態技術為數字人提供了強大的核心能力,包括語言生成、語音合成、視覺呈現和跨模態協同。通過自然語言處理 ( NLP ) 技術,數字人能夠準確理解語義并生成流暢自然的語言回復 ; 利用語音合成技術,數字人具備生動的語音表達能力,并支持多語言和語調調節 ; 在視覺呈現方面,基于圖像和視頻生成技術,數字人能夠展現逼真的面部表情、肢體動作和動態表現。同時,數字人通過整合文本、語音、圖像等多種模態,提供高度自然的互動體驗,顯著提升人機交互的質量和效果。
多模態大模型提升游戲交互體驗
多模態大模型為游戲娛樂提供的核心能力包括自然語言理解與生成,多模態技術結合自然語言處理 ( NLP ) ,使游戲角色能夠理解玩家的語言指令,并進行情景化、語義相關的自然語言回復,增強沉浸感。語音交互與生成,指借助語音合成技術,游戲中的虛擬角色能夠生成生動、情感豐富的語音表達,支持語調調節和多語言輸出。圖像與視頻生成,是利用多模態技術生成逼真的角色形象和動態場景。游戲中的場景、物品、任務等可根據玩家行為動態生成,確保內容的獨特性和互動性??缒B協同與動態輸出,是結合多模態感知與生成技術,游戲系統可以根據實時輸入 ( 如語音、動作 ) 動態調整輸出內容 ( 如場景變化或情節分支 ) 。最后是沉浸式體驗優化,支持玩家通過語音和動作輸入與虛擬世界互動,增強玩家對游戲環境的代入感。
多模態大模型使廣告商拍更高效
多模態技術通過智能創作、精準投放、沉浸式互動和實時優化,為廣告傳媒行業賦能,實現內容生產自動化、廣告傳播個性化以及用戶參與深度化,推動廣告行業向高效化和智能化轉型。多模態大模型推動廣告傳媒行業從內容創作到投放管理的全面智能化轉型,顯著提升創意生產效率、用戶體驗和投放精準度,同時拓展了品牌傳播的互動性與沉浸感。
多模態大模型提升社媒商業化效果
多模態大模型正在重塑社交媒體行業的各個層面,推動了內容創作、用戶推薦、互動體驗、社區治理以及商業化的智能化轉型。通過高效的數據處理和深度的情感理解,社交平臺能夠提供更加個性化、精準和豐富的用戶體驗,同時提高平臺運營效率和商業化效果。
來源:前瞻網