Sora視頻生成模型亮相：技術(shù)驚艷但仍有挑戰(zhàn)

秋秋 ? 2024年3月4日 11:21:00 ? AI

近日，OpenAI展示了其新型視頻生成模型Sora，這一模型在文本轉(zhuǎn)視頻技術(shù)上取得了顯著進(jìn)步。然而，在彭博社進(jìn)行的測(cè)試中，Sora的表現(xiàn)并不完美，出現(xiàn)了一些不符合現(xiàn)實(shí)場(chǎng)景的動(dòng)作，如鸚鵡飛過猴子時(shí)翅膀扭曲，以及猴子身上出現(xiàn)鸚鵡尾巴等。

這些問題反映了Sora在理解和呈現(xiàn)物體物理特性方面的局限性。OpenAI科學(xué)家Bill Peebles也承認(rèn)了這一點(diǎn)，他表示：“確實(shí)會(huì)在片段中找到一些奇怪的動(dòng)作?！?/p>

Sora采用Diffusion transformer技術(shù)，將視頻內(nèi)容分解成一系列patch，并通過去噪技術(shù)預(yù)測(cè)出清晰的原始圖像信息。雖然這種方法優(yōu)化了視頻生成效果，但Sora仍面臨一系列挑戰(zhàn)和局限性。

這些挑戰(zhàn)包括物理交互的準(zhǔn)確性、對(duì)象狀態(tài)變化的一致性、長(zhǎng)期樣本的連貫性、物體的自發(fā)出現(xiàn)、手部和身體部位的處理、計(jì)算資源的需求、模型的泛化能力以及視頻編輯和擴(kuò)展的能力。在復(fù)雜場(chǎng)景中，Sora可能會(huì)出現(xiàn)不符合現(xiàn)實(shí)場(chǎng)景的動(dòng)作，如籃球穿過籃筐側(cè)面、狗在走路時(shí)相互穿過等。

盡管Sora在某些特定場(chǎng)景下表現(xiàn)出色，但OpenAI表示，該模型仍有很長(zhǎng)的路要走，需要解決許多技術(shù)挑戰(zhàn)。隨著技術(shù)的不斷進(jìn)步，我們有理由相信Sora的未來會(huì)更加出色。

原創(chuàng)文章，作者：秋秋，如若轉(zhuǎn)載，請(qǐng)注明出處：http://m.rponds.cn/article/634322.html

OpenAI Sora

秋秋管理團(tuán)隊(duì)

0 0

AI

Encode提交法律意見書反對(duì)OpenAI營(yíng)利轉(zhuǎn)型

近日，針對(duì)人工智能初創(chuàng)企業(yè)OpenAI計(jì)劃轉(zhuǎn)型為完全營(yíng)利性公司的消息，反對(duì)聲音逐漸增強(qiáng)。本周一，Encode這一由年輕人主導(dǎo)的全球性倡導(dǎo)組織正式向法院遞交了一份法律意見書，明確支持…

AI
2天前
新聞

英偉達(dá)2024年豪擲10億美元支持AI初創(chuàng)公司

1月2日，據(jù)英國(guó)《金融時(shí)報(bào)》1 日?qǐng)?bào)道，英偉達(dá)在剛剛過去的 2024 年向人工智能初創(chuàng)企業(yè)投入了 10 億美元資金，成為推動(dòng) AI 革命的重要支持者，而這場(chǎng)革命正是由其芯片技術(shù)驅(qū)動(dòng)…

潮玩君
4天前
AI

ChatGPT中斷數(shù)萬(wàn)用戶受影響后部分恢復(fù)

當(dāng)?shù)貢r(shí)間周四下午，全球知名的人工智能聊天機(jī)器人ChatGPT遭遇突發(fā)中斷，導(dǎo)致數(shù)萬(wàn)用戶無(wú)法正常使用。據(jù)OpenAI官方消息，其AI應(yīng)用程序ChatGPT對(duì)部分用戶出現(xiàn)故障，并在幾個(gè)…

AI
2024年12月27日
新聞

馬斯克：明年底AI智力將超越單個(gè)人類

?12 月 26 日，埃隆?馬斯克于 23 日作出關(guān)于人工智能的大膽預(yù)測(cè)：不久的將來超越所有人類的智力。馬斯克表示，AI 的發(fā)展速度非常驚人，而人類卻未能及時(shí)意識(shí)到這種變化的深遠(yuǎn)…

蘋果派
2024年12月26日
新聞

ChatGPT搜索功能存在被操縱風(fēng)險(xiǎn) 可被惡意網(wǎng)站誘導(dǎo)輸出不可信內(nèi)容

12月26日，根據(jù)英國(guó)《衛(wèi)報(bào)》當(dāng)?shù)貢r(shí)間 24 日發(fā)布的一項(xiàng)調(diào)查，OpenAI 的 ChatGPT 搜索工具可能會(huì)被隱藏內(nèi)容操控，甚至返回惡意代碼。《衛(wèi)報(bào)》測(cè)試了 ChatGPT …

潮玩君
2024年12月26日
AI

OpenAI GPT-5研發(fā)受阻，成本高昂效果未及預(yù)期

近日，《華爾街日?qǐng)?bào)》報(bào)道稱，OpenAI正在研發(fā)的下一代大型語(yǔ)言模型GPT-5遭遇研發(fā)難題，進(jìn)度滯后且成果未達(dá)預(yù)期。這一消息與此前有關(guān)GPT-5可能無(wú)法實(shí)現(xiàn)顯著性能飛躍的報(bào)道相呼應(yīng)…

AI
2024年12月22日
AI

意大利對(duì)OpenAI罰款1500萬(wàn)歐元，因ChatGPT數(shù)據(jù)隱私違規(guī)

近日，意大利數(shù)據(jù)保護(hù)機(jī)構(gòu)Garante發(fā)布公告，宣布對(duì)OpenAI處以1500萬(wàn)歐元（約合1.14億元人民幣）的罰款。這一處罰是在對(duì)生成式AI應(yīng)用使用個(gè)人數(shù)據(jù)情況進(jìn)行調(diào)查后做出的。…

NEWS
2024年12月21日
AI

OpenAI更新macOS版ChatGPT，新增備忘錄及IDE支持

OpenAI近日對(duì)其macOS版ChatGPT應(yīng)用進(jìn)行了更新，新增了支持讀取macOS系統(tǒng)集成的備忘錄App（Apple Notes）及第三方備忘錄App如Notion等功能?，F(xiàn)在…

AI
2024年12月21日
AI

桌面版ChatGPT功能大升級(jí)：新增30余應(yīng)用支持

在OpenAI的“12天活動(dòng)”進(jìn)入尾聲，在活動(dòng)倒數(shù)第二天，公司展示了桌面版ChatGPT的功能改進(jìn)。此次演示強(qiáng)調(diào)，ChatGPT正逐步從聊天機(jī)器人向AI智能體工具轉(zhuǎn)變，旨在桌面環(huán)境…

AI
2024年12月20日
AI

OpenAI o1推理模型API向特定開發(fā)者開放，多項(xiàng)開發(fā)者工具同步更新

近日，在“OpenAI 12天”活動(dòng)的第九天，OpenAI宣布了重要更新。其最新的“推理”人工智能模型o1已正式通過API向部分開發(fā)者開放。據(jù)了解，首批能夠使用o1 API的開發(fā)…

AI
2024年12月18日
AI

谷歌發(fā)布Veo 2視頻生成模型，分辨率是Sora模型的4倍

今日，谷歌公司發(fā)布公告，正式推出視頻生成模型Veo 2。據(jù)官方消息，這個(gè)新模型在理解現(xiàn)實(shí)世界物理、人類運(yùn)動(dòng)和表達(dá)的細(xì)微差別方面表現(xiàn)更出色，從而能夠進(jìn)一步提升視頻整體的細(xì)節(jié)和逼真度。…

Google
2024年12月17日
AI

OpenAI向所有用戶開放ChatGPT搜索功能

在“OpenAI 12天”活動(dòng)進(jìn)展到第8天的時(shí)候，OpenAI發(fā)布了一則重要消息，現(xiàn)在所有登錄用戶都能夠使用ChatGPT搜索功能了。 OpenAI此次免費(fèi)向所有用戶開放ChatG…

AI
2024年12月17日
AI

ChatGPT搜索引擎向所有用戶免費(fèi)開放：新增實(shí)時(shí)搜索和高級(jí)語(yǔ)音功能

OpenAI推出搜索引擎工具，ChatGPT搜索功能獲大量更新，由GPT-4o模型支持，可快速獲取實(shí)時(shí)內(nèi)容，支持高級(jí)語(yǔ)音模式，移動(dòng)端使用效率提升40%以上。

潮玩君
2024年12月17日
新聞

Meta要求加州阻止OpenAI轉(zhuǎn)營(yíng)利計(jì)劃

據(jù)《華爾街日?qǐng)?bào)》今日?qǐng)?bào)道稱，Meta已致信加州總檢察長(zhǎng)Rob Bonta，要求阻止OpenAI轉(zhuǎn)型為營(yíng)利性企業(yè)的計(jì)劃。此舉表明，Meta在硅谷兩大AI巨頭間的爭(zhēng)斗中站在了馬斯克一方…

NEWS
2024年12月14日
AI

OpenAI ChatGPT全球宕機(jī)，部分服務(wù)逐步恢復(fù)中

今日，全球知名的人工智能公司OpenAI遭遇了一次重大服務(wù)中斷，其備受歡迎的聊天機(jī)器人ChatGPT在全球范圍內(nèi)出現(xiàn)了宕機(jī)現(xiàn)象。此外，與ChatGPT相關(guān)的Sora服務(wù)及API接口…

AI
2024年12月12日
新聞

ChatGPT 高級(jí)語(yǔ)音模式研究員創(chuàng)立WaveForms AI 新公司估值達(dá) 2 億美元

近日，有媒體報(bào)道，曾主導(dǎo)開發(fā)ChatGPT高級(jí)語(yǔ)音模式的前OpenAI研究員Alexis Conneau宣布創(chuàng)立WaveForms AI。這家新公司已完成由Andreessen H…

潮玩君
2024年12月11日
AI

OpenAI推出Sora文生視頻AI模型，支持1080P高清視頻生成

昨日，OpenAI公司宣布正式推出其最新的Sora文生視頻AI模型。此次發(fā)布的新版本為Sora Turbo，相較于今年2月推出的預(yù)覽版，生成速度有了顯著提升。據(jù)了解，Sora T…

AI
2024年12月10日
AI

Sora二代實(shí)機(jī)演示曝光，支持圖生視頻功能

近日，關(guān)于Sora二代的實(shí)機(jī)演示視頻被曝光，展示了其強(qiáng)大的圖生視頻功能。據(jù)泄露視頻顯示，Sora v2不僅支持長(zhǎng)達(dá)1分鐘的視頻輸出，還提供了三種生成模式，包括文本轉(zhuǎn)視頻、文本+圖像…

AI
2024年12月9日
AI

OpenAI新功能太強(qiáng)大，每月服務(wù)費(fèi)200美元

近日，OpenAI在其“12天12場(chǎng)直播”活動(dòng)的首秀中，發(fā)布了推理大模型o1的滿血版本及進(jìn)階模式，并推出了ChatGPT Pro訂閱服務(wù)。這一服務(wù)每月收費(fèi)200美元，為用戶提供了前…

AI
2024年12月7日
AI

OpenAI首次在瑞士設(shè)立辦公室，招募翟曉華等3名谷歌工程師推進(jìn)研發(fā)多模態(tài)AI模型

OpenAI將在蘇黎世建新辦公室，拓展歐洲市場(chǎng)，吸納3位谷歌DeepMind AI專家推進(jìn)多模態(tài)AI研發(fā)。蘇黎世為科技中心，翟曉華為資深A(yù)I科學(xué)家，曾是VisionTransformer作者之一。

科技探索者
2024年12月7日

發(fā)表回復(fù)

登錄后才能評(píng)論

Sora視頻生成模型亮相：技術(shù)驚艷但仍有挑戰(zhàn)

相關(guān)推薦

發(fā)表回復(fù)