Sora - cftime.io

有示範片 | OpenAI今日公佈AI影片生成工具Sora AI香港無份！

Admin1 year ago1 year ago01 mins

OpenAI旗下AI影片生成工具Sora正式發佈，但Sora AI香港不設在服務範圍內。科技評論家Marques Brownlee在其影片中率先對Sora的功能進行了深入評測，展示其在生成抽象視覺、卡通和逼真影片方面的強大能力，同時也點出其在物件持久性、物理模擬和影片序列一致性等方面的限制。Brownlee更形容Sora為「既令人恐懼又令人振奮」。即加入CFTime TG 討論區！想掌握最新加密市場動態與 AI 新聞與資訊，更能隨時獲得免費 web 3入場券！ AI影片生成工具Sora AI香港並不包括在內儘管OpenAI尚未發布官方聲明，但此消息已在業界引發廣泛討論。值得注意的是，先前流出的、現已被刪除的說明頁面曾暗示Sora可能不會在歐盟和英國同步推出，香港亦沒有同時發佈，此舉與OpenAI先前推出ChatGPT進階語音模式時，基於法規考量而先排除歐盟和英國市場的策略相符，預期此次Sora的釋出也可能面臨類似的區域性延遲。看更多：OpenAI影片生成模型Sora遭外洩藝術家質疑被「無償工作」 Brownlee的評測影片中展示了Sora的多項功能，包括混音工具、故事板編輯和影片解析度自訂等，所有運算皆由OpenAI伺服器處理，以確保無縫操作。此外，Sora也支援將靜態圖片和迷因製成動畫，但同時也設定了限制，禁止生成涉及版權材料和公眾人物的內容。為確保道德規範，所有生成的影片都將嵌入水印，然而Brownlee也指出，這些防護措施可能存在被規避的風險。有試玩link｜騰訊推出免費開源AI影片生成器混元稱「最佳中國影片生成模型」 Brownlee總結表示：「這是AI影片生成的新基準——既令人興奮，又有很多需要處理。」，此番言論凸顯了Sora強大功能帶來的興奮與潛在挑戰並存的局面。OpenAI預計將在數小時內發布官方公告，進一步說明Sora的細節及相關政策。

有試玩link｜騰訊推出免費開源AI影片生成器混元稱「最佳中國影片生成模型」

Admin1 year ago1 year ago01 mins

中國科技巨頭騰訊（700）近日推出免費且開源的AI影片生成器混元影片，此舉正值OpenAI預計將發布其備受期待的影片工具Sora的12天宣傳活動期間，直接挑戰OpenAI在AI影片生成領域的領先地位。試玩link在此（注意：免費設有上限）即加入CFTime TG 討論區！想掌握最新加密市場動態與 AI 新聞與資訊，更能隨時獲得免費 web 3入場券！騰訊宣稱，根據專業人士的評估，混元影片的生成性能可與甚至超越現有領先的閉源模型，包括Runway Gen-3、Luma 1.6以及三款表現最佳的中國影片生成模型。騰訊在其官方公告中明確指出：「我們介紹的混元影片是一種新穎的開源視訊基礎模型，其影片生成性能可與領先的閉源模型相媲美，甚至優於它們。」混元影片採用解碼器專用的多模態大型語言模型作為文本編碼器，而非業界常用的CLIP和T5-XXL組合。騰訊表示，此設計能提升模型遵循指令、掌握圖像細節以及快速學習新任務的能力，其因果關係注意力機制更藉由特殊的標記優化器，增強對提示詞的理解。此外，混元影片還能改寫提示詞，使其更豐富，進而提升生成品質。例如，簡單的提示「一個男人遛狗」可以被增強，加入細節、場景設定、光照條件、品質瑕疵和人物種族等元素。開源策略，但需高規格硬體支援與Meta的LLaMA 3類似，混元影片在用戶數達到1億之前，皆可免費使用和商業化。然而，本地運行其130億參數的模型需要至少60GB GPU記憶體的高規格電腦，例如Nvidia H800或H20卡，遠超一般遊戲PC的配置。為此，多家雲端服務商已提供支援。例如，FAL.ai已整合Hunyuan，每個影片收費0.5美元；Replicate和GoEhnance也提供訪問權限；官方混元影片伺服器則提供10美元150點數，每個影片生成至少需15點數。用戶亦可透過Runpod或Vast.ai等服務租用GPU運行模型。初步測試顯示，混元影片的品質可與Luma Labs Dream Machine或Kling AI等商業產品匹敵，影片生成時間約為15分鐘，能產生具有逼真效果的序列，人物和動物動作自然流暢。但測試也發現，目前模型對英文提示詞的理解能力仍有待提升。然而，開源特性讓開發者得以參與改進。騰訊表示，根據內部測試，混元影片的文本編碼器匹配率（輸出與用戶請求的匹配程度）高達68.5%，同時保持96.4%的視覺品質得分。完整的原始碼和預訓練權重已上傳至GitHub和Hugging Face平台。此舉被視為騰訊在AI領域積極布局，並挑戰OpenAI領導地位的重要一步。

OpenAI影片生成模型Sora遭外洩藝術家質疑被「無償工作」

Admin1 year ago1 year ago01 mins

據科技新聞網站TechCrunch報導，OpenAI 期待已久的影片生成模型Sora遭外洩。一個匿名團體透過AI開發平台Hugging Face，取得並公開分享了尚未公開發布的Sora API存取權限，此舉引發藝術家社群強烈反彈。即加入CFTime TG 討論區！想掌握最新加密市場動態與 AI 新聞與資訊，更能隨時獲得免費 web 3入場券！該團體在Hugging Face上建立名為「PR Puppet Sora」的程式庫，提供使用者透過前端介面生成1080p解析度、長度為10秒的影片。該前端介面同時包含一封公開信，直指OpenAI在Sora早期試用計畫中剝削藝術家未付薪勞動，並嚴格控制敘事方向。 Sora遭外洩數百位藝術家被「無償工作」公開信中指出，數百位藝術家參與Sora的錯誤測試、回饋和實驗性工作，卻未獲得任何報酬，而OpenAI的估值已達1500億美元。該團體批評OpenAI將公共關係和廣告宣傳置於藝術家創意表達和批判之上，要求所有使用Sora生成的內容皆需事先獲得批准，且僅有少數創作者的作品會被公開展示。「我們並不反對將AI技術作為藝術工具使用，」公開信寫道，「我們不同意的是這個藝術家計畫的推出方式，以及該工具在可能公開發布之前的發展方向。」根據X平台使用者發現的程式碼，外洩的版本似乎是Sora的「Turbo」加速版本。原先在二月發布的Sora，據報導生成一分鍾影片需要超過十分鐘的時間。值得注意的是，該前端介面最近更新，聲明OpenAI已暫時關閉所有藝術家的Sora早期試用計畫。儘管OpenAI首席產品長Kevin Weil曾表示，公司延遲Sora的發布是為了「完善模型、確保安全/模仿/其他事項正確，並擴展運算能力」，但在Sora外洩後，網路上已出現大量使用外洩模型生成的影片，許多X平台使用者卻認為其效果不如預期，質疑OpenAI幾個月來的「嚴格控管」。 X平台使用者「Chubby」分享的影片顯示，Sora外洩模型生成的影片在動作和美學風格上與先前發布的文字轉圖像模型相似，進一步加深外界對Sora實際能力的質疑。此外，OpenAI近期也面臨其他挑戰，包括Sora共同負責人Tim Brooks於十月跳槽至Google，以及競爭對手Runway和Stability AI透過與主要電影公司合作，快速取得市場優勢。 Sora外洩事件，不僅凸顯OpenAI在AI模型開發與藝術家合作模式上的爭議，也暴露其在技術成熟度和市場競爭力上的隱憂。

即睇片｜快手Kling AI 影像生成器全球上線快一步挑戰 OpenAI的Sora

Admin2 years ago2 years ago01 mins

日前快手（1024）正式宣佈其 AI 影像生成器平台 Kling AI 全球上線，推出 1.0 版本，不再局限於中國市場。使用者現在可以在 KlingAI.com 上註冊使用，只需提供電子郵件地址即可。想掌握最新加密市場動態與 AI 新聞與資訊，與行業專家交流？即加入CFTime Whatsapp 討論區！仲有 CFTime Facebook 同 IG！註冊後，使用者每天可獲得 66 個免費的影片製作額度。該平台支援文字轉影片和圖片加文字轉影片的生成方式，直接挑戰 OpenAI 備受矚目的 Sora，後者目前仍處於限量測試階段。 Kling AI生成速度相當驚人 Kling AI 的影片生成速度相當驚人，平均約 5 分鐘即可完成。對於 30fps 的 5 秒短片來說，大約需要 1 分鐘生成 1 秒的影片，或 0.5 秒生成一幀。考慮到傳統的 AI 影像生成器通常需要數秒才能生成單一高解析度影像，這個速度相當驚人。快手表示，他們承諾的長篇影片生成功能將在未來更新中推出。Kling AI 的輸出具有多樣性，使用者可以選擇三種影片解析度：960×960 的正方形格式、720p 横向和 720p 縱向模式。該平台還擁有攝影機控制功能，允許使用者選擇靜態、水平、垂直、平移、傾斜或旋轉的攝影機移動方式。 Kling AI 支援多種語言，測試結果證實，英文和普通話的提示都能產生高品質的影片。使用者還可以透過調整創意和相關性之間的平衡來微調作品。偏向相關性可以確保更符合提示內容，而偏向創意則可以產生更具想像力、更具視覺衝擊力的結果。該平台還接受負面提示，這可能會提高準確性。在與 OpenAI 的 Sora…

玩具反斗城用AI製作廣告引發爭議評論：「可恥抄襲之作」

Admin2 years ago2 years ago01 mins

自從2022年ChatGPT爆發式出現以來，人工智能在廣告製作中的應用一直是一個有爭議的話題。玩具反斗城用AI製作廣告引發爭議。一位演員更稱這部長60秒的作品是由OpenAI的Sora製作的「怪物」。想掌握最新加密市場動態與 AI 新聞與資訊，與行業專家交流？即加入CFTime Whatsapp 討論區！傳統玩具零售商玩具反斗城推出了他們所稱的「歷史上首部品牌電影」，使用了OpenAI即將推出的短片工具Sora。這部長一分鐘的電影上週在2024年康城國際創意節首映，並於週二在網上公開發佈。然而，受到不少業內人士爭議。玩具反斗城用AI製作廣告「幾乎完全」由Sora以文本提示生成這部名為「玩具反斗城的起源」的短片，講述玩具反斗城創辦人Charles Lazarus的創業故事，他是一位自行車店老板的兒子，在1957年創立了這家玩具店。該視頻擁有許多「幾乎完全」由Sora以文本提示生成的視覺特效，賦予了公司的吉祥物吉利長頸鹿Geoffrey生命。根據新聞稿介紹，該公司與獲提名艾美獎的創意代理機構Native Foreign合作製作了這部電影。由獨立搖滾樂隊Copeland的Aaron Marsh創作原創音樂配樂。 Native Foreign 創意總監 Nik Kleverov在新聞稿中表示：「通過Sora，我們能以驚人的速度和效率講述這段令人難忘的故事。」根據公告，團隊能夠「在短短數週內將一個概念變為現實，將數百個迭代鏡頭縮減到幾十個」。然而，仍需要進行一些視覺特效修正。雖然Kleverov稱讚玩具反斗城採用「AI先導戰略」來「引領創新敘事的下一波浪潮」，但這部品牌電影在網上引發了參差不齊的反應。相關新聞：美國唱片業協會起訴AI音樂服務公司自稱是AI製片人的Allen T.在推特上表示，「未來將是有趣的時期」，並指出玩具反斗城的電影在描繪手部細節和保持人物形象在場景之間的連貫性方面存在問題。演員、編劇兼製片人Luke Barnett在 X 上寫道：「玩具反斗城應該為助長這種瘋狂行為以及製作如此糟糕的廣告而感到羞恥。」演員Elias Toufexis提到玩具反斗城公司面臨的財務困境，寫道：「我很高興玩具反斗城已經倒閉了。他們應該永遠不要復出。」作家兼播客Theo Priestley稱這個廣告是「怪物」，並指出玩具反斗城缺乏想像力和對核心受眾的關注。 Theo Priestley在 X 上稱這個廣告是「可恥的」。他在文中表示：「他們明顯地不願意花錢請真正的創作者和兒童演員。這本身就對他們缺乏想像力和對核心觀眾的漠不關心發出了強烈的聲明。」他並指：「也許有些創意工作將會消失，但或許它這是 @ToysRUs 的一個可恥之作。他們不僅使用了一個以數千名藝術家的剽竊作品和未經授權的知識產權訓練的AI工具，而且顯然太吝嗇以致於不願意使用真正的創作者和兒童演員。這本身就對他們缺乏想像力和對核心觀眾的漠不關心發出了強烈的聲明。」自ChatGPT於2022年嶄露頭角以來，AI在電影製作和創作領域的應用一直存在著分歧。這也是去年荷里活長期罷工的一個關鍵問題。支持這項技術的人往往引起廣泛的憤怒。 OpenAI 技術總監 Mira Murati 日前表示：「一些創意工作可能會消失，但或許一開始它們就不該存在。」言論引起演員Ashton Kutcher引起了極大的憤慨，當他推崇像Sora這樣的工具可以節省時間和金錢在電影製作上。在回應反彈後，Mira Murati 將採用AI技術視為不可避免。「這是一個了不起的工具，我們應該學會與之合作，讓我們作為藝術家更加富有成效和高效率。」 Kutcher在回應反彈時在Ｘ上寫道。「假裝它不存在將是災難性的。」 Sora目前正處於封閉測試階段，只有一小部分創作者正在測試這個工具。但自從它宣佈以來，競爭對手也紛紛推出了類似或更先進的文本到視頻AI模型。Synthesia、Lumalabs和Runway等公司已經宣布推出了自己的視頻生成平台。中國的科技公司也加入了這一領域，快手的Kling和生數科技的Vidu提供了令人印象深刻的AI生成位片內容的能力，其產生的結果可與OpenAI展示的相媲美。無論如何，廣告製作中的AI應用仍然是一個新興領域，需要不斷探索和討論。這些爭議和反響表明了人們對於AI在創意領域的角色和影響的關注，並促使我們思考如何在AI和人類創意之間找到平衡點。

GPT-4被揭進行秘密更新「懶惰」現象將會改善？

Admin2 years ago2 years ago01 mins

GPT-4被揭進行秘密更新。OpenAI的最新商業AI模型GPT-4 Turbo於2023年接受了一次秘密更新，該消息並未經開發商廣泛公告。根據OpenAI網站上的文件，GPT-4 Turbo的訓練數據集最近的更新截至2023年12月，使其成為OpenAI提供的最新模型。掌握最新加密市場動態與 AI （ChatGPT）新聞與資訊，請即追蹤 CFTime Facebook 及 Google 新聞！這次更新的目的是減少模型出現的所謂「懶惰」現象，即無法完成所要求的任務。與之相比，免費模型GPT 3.5只包含了截至2022年1月的相關數據。 GPT-4被揭進行秘密更新使GPT-4 Turbo具備了至2023年12月相關數據根據網站上的資訊，該更新使GPT-4 Turbo具備了直至2023年12月的相關數據，使其成為目前OpenAI提供的最為時新的模型。然而，在最近的一次更新中（於2024年1月25日），並未提及GPT-4 Turbo訓練數據集的更新。這引起了OpenAI開發者論壇上有關此更新合法性的疑問。一些用戶觀察到他們的預覽似乎並未更新至2023年12月，而是返回了先前更新時間範圍內的回答，如“截至2023年4月…”。然而，其他用戶的回復則顯示出積極的結果，模型回答說它們的信息包括從2023年12月開始更新的數據。這次對OpenAI最先進模型的最新更新發生在該公司剛剛展示了其先進的文本到視頻模型Sora的幾天之後。Sora模型以其逼真的輸出讓社交媒體上的用戶驚嘆不已。OpenAI聲稱Sora能夠生成包含多個角色、特定動作和主題以及背景細節的類似電影的場景，分辨率高達1080p。然而，該開發者表示該模型仍未準備好公開發布。根據《紐約時報》2月17日的報道，OpenAI在最新交易中的估值飆升至800億美元。該公司目前正在與全球投資者以及國際政府進行談判，以籌集資金自行開發AI晶片。 OpenAI的GPT-4 Turbo模型的這次秘密更新使其成為目前最為時新的AI模型，並表明OpenAI在不斷努力提升其技術和產品，以滿足日益增長的市場需求。這也顯示出AI技術在各個領域的快速發展，並且對於未來的數字化社會具有巨大的潛力和影響力。

OpenAI推出Sora 根據文字指令創作長時間短片

Admin2 years ago2 years ago01 mins

OpenAI推出Sora的新人工智慧模型，能夠根據文字指令創作長時間引人入勝的短片，時長可達一分鐘。目前Sora處於封閉測試階段，只對受邀的開發人員開放。想掌握最新加密市場動態與 AI 新聞與資訊，與行業專家交流？即加入CFTime Whatsapp 討論區！文字到短片的轉換並非未知領域，RunwayML和Pika Labs等公司已經在這個領域有一段時間，並通過能夠在幾秒鐘內創造出令人驚艷的視覺效果的模型在市場上佔據主導地位。然而，這些短片往往比較短，隨著時間的推移，故事的焦點和連貫性也會失去。OpenAI希望通過Sora實現一致性，在生成高度細緻的、時長一分鐘的短片時能夠流暢地呈現和演變。這並不是一個簡單的目標，因為AI模型需要從頭開始即興創作每一個畫面。單一畫面中的微小缺陷可能會引發一系列幻覺和不真實的圖像。然而，OpenAI似乎已經取得了進展，Sora展示出了流暢、引人入勝的視覺效果，目前在這個領域尚無可匹敵的模型。OpenAI在網上發佈了示例短片，一些短片也被非官方地重新發佈在YouTube上。 OpenAI與其他正在測試生成式短片的AI公司展開競爭。受歡迎的文本到圖像生成器Midjourney最近宣佈正在開發文本到短片生成器，但沒有提供發布日期。此外，Stability AI最近推出了其開源產品Stable Video Diffusion，能夠生成576×1024分辨率的25幀短片。甚至Meta也展示了其EMU短片生成器，這是其將AI融入社交媒體和元宇宙的努力的一部分。 OpenAI推出Sora 目前僅限於有限發佈 Sora目前僅限於有限發佈，OpenAI將提供給「視覺藝術家、設計師和電影製片人」使用，以獲取反饋。Sora通過理解語言的方式與眾不同，它能夠在解釋書面指令的細微差別時生成生動、高度細節的圖像。需要特定的鏡頭運動？多個具有真實情感的角色？都不是問題。 Sora甚至能夠在同一短片中無縫切換不同鏡頭鏡頭，這與一些短片編輯工具的功能相似。然而，AI創造力也有其特點。Sora還不是一位完全的電影大師。它可能在物理或複雜的因果關係上遇到困難，換句話說，儘管它已經是最一致的短片生成器之一，但它無法達到絕對的忠實度水平，因此可能會出現幻覺。此外，作為OpenAI的作品，Sora無疑會受到嚴格審查。該公司強調其對安全測試和檢測工具的關注，以標識潛在有害和具有誤導性的內容。OpenAI正在與紅隊合作，完善其模型，並希望其早期發布策略能夠在未來幾年內促進建立日益安全的AI的合作。 Sora的更廣泛實施尚未宣佈具體的推出日期。