OpenAI推出Sora 根據文字指令創作長時間短片

OpenAI推出Sora

OpenAI推出Sora的新人工智慧模型,能夠根據文字指令創作長時間引人入勝的短片,時長可達一分鐘。目前Sora處於封閉測試階段,只對受邀的開發人員開放。

想掌握最新加密市場動態與 AI 新聞與資訊,與行業專家交流?即加入CFTime Whatsapp 討論區

文字到短片的轉換並非未知領域,RunwayML和Pika Labs等公司已經在這個領域有一段時間,並通過能夠在幾秒鐘內創造出令人驚艷的視覺效果的模型在市場上佔據主導地位。

然而,這些短片往往比較短,隨著時間的推移,故事的焦點和連貫性也會失去。OpenAI希望通過Sora實現一致性,在生成高度細緻的、時長一分鐘的短片時能夠流暢地呈現和演變。這並不是一個簡單的目標,因為AI模型需要從頭開始即興創作每一個畫面。單一畫面中的微小缺陷可能會引發一系列幻覺和不真實的圖像。

然而,OpenAI似乎已經取得了進展,Sora展示出了流暢、引人入勝的視覺效果,目前在這個領域尚無可匹敵的模型。OpenAI在網上發佈了示例短片,一些短片也被非官方地重新發佈在YouTube上。

OpenAI與其他正在測試生成式短片的AI公司展開競爭。受歡迎的文本到圖像生成器Midjourney最近宣佈正在開發文本到短片生成器,但沒有提供發布日期。此外,Stability AI最近推出了其開源產品Stable Video Diffusion,能夠生成576×1024分辨率的25幀短片。

甚至Meta也展示了其EMU短片生成器,這是其將AI融入社交媒體和元宇宙的努力的一部分。

OpenAI推出Sora 目前僅限於有限發佈

Sora目前僅限於有限發佈,OpenAI將提供給「視覺藝術家、設計師和電影製片人」使用,以獲取反饋。Sora通過理解語言的方式與眾不同,它能夠在解釋書面指令的細微差別時生成生動、高度細節的圖像。需要特定的鏡頭運動?多個具有真實情感的角色?都不是問題。

Sora甚至能夠在同一短片中無縫切換不同鏡頭鏡頭,這與一些短片編輯工具的功能相似。然而,AI創造力也有其特點。Sora還不是一位完全的電影大師。它可能在物理或複雜的因果關係上遇到困難,換句話說,儘管它已經是最一致的短片生成器之一,但它無法達到絕對的忠實度水平,因此可能會出現幻覺。

此外,作為OpenAI的作品,Sora無疑會受到嚴格審查。該公司強調其對安全測試和檢測工具的關注,以標識潛在有害和具有誤導性的內容。OpenAI正在與紅隊合作,完善其模型,並希望其早期發布策略能夠在未來幾年內促進建立日益安全的AI的合作。 Sora的更廣泛實施尚未宣佈具體的推出日期。