OpenAI公開展示最新影片生成AI模型Sora,號稱能將文字轉成最高60秒且具複雜運鏡、多角色的高品質影片。
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
綜合外媒報導,ChatGPT開發者人工智慧研究實驗室OpenAI 今日(16日)在公開展示最新文字轉影像AI模型Sora(日文「空」羅馬拼音)的產品影片,並附上該影像的指令,宣稱此模型能生成最多60秒的豐富場景細節、多角色及複雜運鏡影片。
Sora 使用約1萬小時的「高品質」影片訓練,OpenAI 表示,Sora 是基於 DALL·E、GPT 模型的研究成果,一方面使用 DALL·E 3 的重述技術,能專為視覺資料生成高度描述性的標題,所以 Sora 可以更忠實地、也更新深入遵循使用者的文字指令,並生成情感豐富、引人入勝的角色,甚至 Sora 還能深入理解指令提到的人、事、物在現實物理世界中真正存在的面貌。
OpenAI官網說明,此模型不僅可以文字轉影音,也可以從靜態圖像或將現有影像延伸成影片,「我們正在訓練AI瞭解並模擬真實世界的動態,希望能夠幫助使用者解決一些需要真實世界互動的難題」。
據悉,目前OpenAI 並沒有將 Sora 完全開放,只有部分研究者、影片創作者,以及扮演「紅隊」(Red Team)測試以預防有心人士利用各種方式繞過OpenAI的服務條款,包括禁止極端暴力、性內容、仇恨圖像、名人臉孔或盜用智財等等規範。