Sora 2是OpenAI最新一代的影片生成模型,被外界形容為「影片界的 GPT-3.5」,在真實感、物理規律與可控性上均大幅超越初代版本。相較前代模型會出現「物體穿模」或「物理失真」的狀況,Sora 2能更精確模擬現實世界的運動與互動。例如,若籃球員投籃失手,球會自然彈向籃板而非「自動入框」,顯示模型已能理解物理中的失敗情境。

除了擬真畫面,Sora 2也新增聲音同步與環境音效生成功能,可產出具備對話與背景聲的完整影片。OpenAI 表示,這是邁向「通用影音生成系統」的重要一步,用戶甚至能上傳短片,讓模型捕捉其樣貌與聲音,將本人融入各式場景中。此「cameo」功能是新推出iOS應用程式《Sora》的核心特色,用戶可透過邀請制註冊體驗,錄製自我肖像後便能與朋友互相「客串」影片。

目前,Sora 2僅在美加地區的Apple App Store上架,仍採邀請制試用,Android版本尚在開發中。ChatGPT Pro用戶可在sora.com使用實驗版Sora 2 Pro模型。OpenAI表示,未來將陸續開放更多國家地區,並於API中導入Sora 2技術,目標是推進AI世界模擬與共同創作的新時代。