諮詢熱線:02-2369-8858

LPM 1.0 是什麼?米哈遊打造會「即時互動」的 AI 虛擬人

最後更新:2026/05/07 作者:Bordy
加入好友
LPM 1.0 是什麼?米哈遊打造會「即時互動」的 AI 虛擬人

近期,由米哈遊(miHoYo)創始人蔡浩宇旗下的 AI 公司發布了震撼業界的 Large Performance Model 1.0 (LPM 1.0,大型角色表演模型)。這個新技術不再只是單純的影片生成工具,而是專注於「第一視角虛擬人物互動表演」的視覺引擎。過去我們曾驚豔於 Sora 或 Veo3 所生成的高畫質人類表演影片,但那些模型本質上是「世界模擬器」,難以用於即時對話。LPM 1.0 的出現,徹底解決了虛擬人物在實際互動中最核心的痛點:如何讓 AI 像真人一樣,具備自然的對話、傾聽反應、情緒表達,並且長時間維持形象不崩壞(不發生臉部漂移)?這篇文章將帶您深入了解 LPM 1.0 的技術突破,以及為何它將引領我們進入「億萬個虛擬人物」的新紀元。

一、 破解產業魔咒:「表演三難困境」

如果你曾看過或用過 AI 數位人(如 AI 主播、AI 客服),你一定會發現它們的通病:永遠只會機械式地對口型,眼神空洞,或是只要生成時間一長,人物的臉龐和服裝就會開始變形。

這在業界被稱為「表演三難困境」,即現有技術無法同時滿足以下三點:

  1. 高表現力(極致真實的微表情、肢體語言)

  2. 即時推理(極低延遲的互動對話)

  3. 長時身分穩定性(聊了十分鐘、半小時後,人物長相和衣服依然一致)

LPM 1.0 成為全球第一個從系統底層徹底打破這個困境的模型,讓虛擬人物首次具備了「雙向互動」的靈魂。

圖片來源:LPM-1.0

二、 LPM 1.0 的三大核心技術亮點

根據官方釋出的論文與技術說明,LPM 1.0 之所以能達到如此驚人的效果,歸功於以下幾個關鍵技術:

1. 嚴苛篩選的 3100 萬高品質訓練數據

想讓 AI 擁有真人的演技,就必須餵給它最真實的表演資料。研發團隊收集了海量以「人物互動」為中心的影片,並經過極度嚴苛的淘汰機制(保留率不到 10%),最終留下 3100 萬個片段。

最特別的是,資料不僅標註了「說話」狀態,還史無前例地精細標註了「傾聽」「閒置」狀態。這讓 AI 學會了在別人說話時點頭、微笑、眼神流轉,而不是像木頭一樣呆站著。

2. 基於 WAN 2.1 的 170 億參數 DiT 架構與聲音處理

LPM 1.0 是一個標準的 DiT(Diffusion Transformer)模型,擁有高達 170 億(17B)的參數量。它是建立在開源的 WAN 2.1 I2V(圖生影片)模型基礎上進行深度優化的。

為了完美處理聲音與表情的關聯,LPM 採用了創新的「交錯雙音頻注入」技術:

  • 說話時:模型會調動嘴唇同步與高頻面部肌肉。
  • 傾聽時:模型會根據聽到的內容,產生低頻的肢體反應(如皺眉、會心一笑)。

3. 從高畫質到「即時流式互動」的 Online LPM

基礎模型(Base LPM)雖然能生成極度逼真的長影片,但運算時間較長。為了解決這點,團隊利用多階段自迴歸蒸餾技術,開發出了 Online LPM。這使得模型能夠進行無上限時間的即時推論,直接化身為低延遲的視訊通話對象。

三、 我們為何要高度關注 LPM 1.0?

LPM 1.0 不僅僅是 AI 圈的一次技術火力展示,它將對整個數位內容生態與娛樂產業產生顛覆性的影響。這也是為什麼我們說,它將催生「億萬個虛擬人物」的原因:

1. 創作者與 YouTuber 的全新工作型態

誠如許多網友的驚嘆:「如果這個技術開源或普及,YouTuber 就不需要每次都親自上陣了!」

未來的創作者只需提供聲音、文案或即時對話指令,LPM 就能生成一個完美的數位分身幫你拍攝影片,甚至代班開直播。它能根據聊天室的留言做出真實的驚訝、大笑反應,大幅降低影片製作與直播的體力成本。

2. 遊戲 NPC 迎來「靈魂升級」(米哈遊的強項)

想像一下未來的《原神》或《絕區零》,遊戲中的 NPC 不再只是重複播放幾組待機動畫和文字框。當你用語音跟 NPC 聊天時,他們會看著你的眼睛,因為你的玩笑而展露微笑,或是因為你的冒犯而皺眉。這將打破虛擬與現實的邊界,帶來前所未有的沉浸感。

3. 終極的 AI 情感陪伴

目前的 ChatGPT 或 Claude 雖然聰明,但依然是冰冷的文字或語音。LPM 技術將使得 AI 助理具備「臉孔與情緒」。當你在傾訴煩惱時,螢幕裡的虛擬人物會專注地看著你並流露同情的表情。這種提供情緒價值的能力,將讓虛擬伴侶、AI 心理諮詢等應用迎來爆發式成長。

結語

從過去的「文字對話」,到 Sora 時代的「影片生成」,再到如今 LPM 1.0 所展示的「即時角色表演」,AI 正在以不可思議的速度跨越恐怖谷理論的障礙。

雖然目前 LPM 1.0 在多人互動、動態複雜場景的物理碰撞上還有進步空間,但它已經成功證明了:一個具備自然情緒、能看、能聽、能說的虛擬人物是完全可以被實現的。隨著這類技術的持續演進與潛在的開源生態,我們準備好迎接每個人都擁有專屬虛擬 AI 夥伴的新時代了。

延伸參考資源:

 

還想了解更多各類數位行銷資訊的話,歡迎訂閱電子報、加入奇寶Line好友,第一時間接收最新資訊!後續我們台北移動學苑還會陸續舉辦各類型的行銷課程,也歡迎有興趣的行銷人可以加入我們臉書粉絲團,在粉絲專頁上與我們討論喔!

Facebook粉絲專頁:

奇寶網路
台北移動學苑

歡迎轉載KPN奇寶部落格相關文章,在轉載前請先詳閱著作權聲明轉載原則

熱門文章

一篇帶你了解Google商家檔案(我的商家)驗證....

Google 商家檔案是一個免費的工具,能增加企業在 Google 地圖的能見度。透過管理商家檔案,商家可以優化在 Google 中搜尋的內容,搜尋公司相關產品或是公司名稱的時候,如果能夠跳出畫面右方紅框的資訊,對於商家絕對是大大加分!消費者也可以更方便快速的找到需要的服務....

SEO 是什麼?2026 AI趨勢下的SEO優化入門,....

SEO(搜尋引擎優化)是一套綜合性的數位行銷策略,透過對網站內容、技術架構與外部連結的優化,提升網站在搜尋引擎(如 Google)自然搜尋結果中的可見度與排名。這項長期經營策略不僅能持續帶來精準的自然流量,更能有效降低行銷成本,並逐步建立品牌權威與市場信任度。....

2025 STP分析全攻略:3步驟精準市場定位與行....

在現今競爭激烈的市場環境中,「STP分析」是企業行銷策略中不可或缺的一環。但究竟STP分析是什麼呢?STP即是市場區隔、目標市場與市場定位的縮寫,是企業進行客群分析、精準抓住消費者需求的重要工具。尤其在數位時代,消費者的喜好每天都在變化,科技又不斷推陳出新,學....

2025年Facebook粉絲專頁設置全攻略:提升品....

想一次搞懂2025年FB粉絲專頁設定?Facebook粉絲專頁(Fan Page)是企業、品牌、公眾人物與組織在Facebook上的官方互動平台。透過建立並優化您的粉專,不只能大幅提升品牌曝光,還可以追蹤和分析粉絲互動數據,幫助您持續優化行銷策略,牢牢抓住每一次社群行銷機會。 ....

延伸閱讀

Codex 是什麼?ChatGPT 程式助手進化揭秘,....

「你可能早就習慣用 ChatGPT 寫文案、改句子,甚至寫簡單程式;但在 2025 年,OpenAI 將 Codex 正式推向前台,它能真正「下場動手」幫你操作整個開發流程。」 也許你會想:ChatGPT 本來就能寫程式、解釋代碼、幫我 debug,為什麼還要另一個 “Codex”?這不....

Pomelli 是什麼?Google 推出 AI 內容生成工....

2025/10/29 Google Labs 推出的 Pomelli,是一款能自動生成品牌風格、內容素材與行銷文案的 AI 工具,讓中小企業也能輕鬆建立專屬的品牌形象。只要輸入你的網址,Pomelli 便能分析字體、顏色、語氣與影像風格,自動生成貼近品牌個性的素材。無論是網站橫幅、社群貼文,或....

Gemini 生成圖片新功能,行銷人員必學素材編....

你是內容創作者、社群小編或行銷人員嗎?如果常為素材合成、商品上模或人物置入頭痛,Gemini 在圖片編輯上的新能力可能會成為你的利器。根據官方說明,Gemini 應用已新增「合成多張照片/自然合成兩張照片」等功能,支援將多張影像結合、保留主體樣貌並進行多輪對話式編....

了解ChatGPT:應用及未來發展全攻略

在現代數位時代,人工智慧(AI)技術的飛速發展正在深刻影響我們的生活和工作方式。特別是在自然語言處理領域,ChatGPT 作為最先進的 AI 模型之一,已廣泛應用於多個行業和領域,從教育、商業、行銷到客戶服務和創意寫作等方面,無不展現出其強大的功能與潛力。本章節將....

本網站使用cookies於廣告、社群與分析等用途,藉以增進您的使用體驗,繼續使用本網站即代表您同意使用cookies,請參閱我們的 cookie聲明以獲得更多資訊。

Copyright © KPN SEO 2020. All Rights Reserved / 台北市大安區羅斯福路三段301號8樓 02-23698858 service@kpnweb.com