CVPR為全球計算機視覺與AI領域最具影響力的國際會議之一,每年吸引各大科技公司與頂尖學術單位參與。鴻海研究院已連續兩年於該會議獲獎,今年6月13日團隊正式發表自研的「ModeSeq」模型,主打多模態軌跡預測能力,可大幅提升自駕車對於周遭交通參與者行為的預測準確度與多樣性。該技術結合因式分解變換器(Factorized Transformers)與記憶模組,設計創新損失函數EMTA(Early-Match-Take-All),有效解決過往多軌跡預測模型表現受限的問題。
經進一步優化後推出的「Parallel ModeSeq」,在2025年CVPR WAD workshop的互動預測競賽中,以優異成績奪冠。團隊在mAP、soft mAP兩大關鍵指標表現最佳,並在minADE、minFDE等核心預測誤差指標維持領先水準。
鴻海研究院人工智慧研究所所長栗永徽表示,ModeSeq技術具備強大的模態外推能力(mode extrapolation),可根據場景複雜度,動態調整預測軌跡數量,讓系統以更低計算成本提供更安全與精準的決策基礎。「我們的研究成果發表於CVPR,代表已站上世界最前沿的舞台。」栗永徽強調。
本次研究由鴻海研究院攜手香港城市大學汪建平教授團隊與卡內基美隆大學合作完成,彰顯鴻海在跨國學研合作、AI技術創新、自駕演算法實力上的深厚底蘊。展望未來,鴻海研究院將持續深化AI自駕技術的研發能量,進一步拓展國際影響力,並為智慧移動產業注入更多創新動能。