韓國電子通信研究院(ETRI)近日研發出一種超現實人工智能技術,僅需使用一張人物肖像照片,即可創建出能像真人般自然對話的數字頭像。

這項技術被視為面向全自動駕駛時代的新一代人機交互界面,預計將在數字人產業中廣泛應用。與傳統辦公場景的語音助手或車載導航系統僅能執行簡單指令不同,ETRI開發的超現實AI數字人具備精細的面部表情和口型變化,能夠實現擬真的人類對話。

該技術的核心在于其獨創算法——與傳統生成式AI不同,它會選擇性學習嘴唇、下巴等與發音直接相關的面部區域,通過減少無關信息的學習量,實現包括口型、牙齒乃至皮膚皺紋在內的微表情呈現。ETRI表示,該技術在合成畫質與唇語同步準確度方面表現優異,相關成果已在CVPR、AAAI等國際頂級會議上發表。

除自動駕駛領域外,這項技術還可應用于自助服務終端、銀行柜臺、新聞播報、廣告模特等多個場景,有望推動AI數字人產業的革新。ETRI移動用戶體驗研究室目前正重點研發人機交互(HMI)技術,同時開發能分析駕駛員、行人情緒狀態及疲勞度、專注度等指標的AI駕駛界面技術。

研究室主任尹大燮指出:"隨著移動技術日益復雜,老年群體和社會弱勢群體可能面臨技術鴻溝。我們希望通過這項AI數字人技術提升全民數字素養,讓智能出行服務真正普惠大眾。"高級研究員崔大雄補充道:"我們將持續優化生成式AI技術,使數字人能像真人一樣自然交談和行動。未來目標是實現咨詢、點餐等場景的人力替代。"

目前該技術已作為"擬真對話人臉生成框架"在ETRI技術轉讓平臺注冊。研究團隊表示將積極推動多行業技術轉移與商業化落地。

精選文章:

十大斯堪的納維亞風格住宅:北歐設計與建筑的極致呈現

MAD建筑事務所以"中國紙傘"重塑傳統工藝亮相2025威尼斯雙年展

Shutterstock全面押注生成式AI,品牌形象煥新升級

網頁設計將成為用戶心理剖析的藝術

從食物垃圾到時尚,下一代設計2025大賽獲獎者重新設計未來