Stability AI發(fā)布Stable Video Diffusion模型把靜態(tài)圖片生成高質(zhì)量的視頻

AI ? 2023年11月22日 19:39:00 ? AI

初創(chuàng)公司Stability AI專注于開發(fā)人工智能（AI）產(chǎn)品，最近發(fā)布了一款令人期待的AI模型——Stable Video Diffusion。這款模型的獨特之處在于，它能夠通過現(xiàn)有的靜態(tài)圖片生成高質(zhì)量的視頻，是基于之前發(fā)布的Stable Diffusion文本轉(zhuǎn)圖片模型的延伸。目前市面上能夠生成視頻的AI模型相對較少，因此Stable Video Diffusion引起了廣泛關注。

然而，需要注意的是，Stable Video Diffusion目前并不對所有人開放。它目前處于Stability AI所謂的“研究預覽”階段。想要使用這款模型的人必須同意一些使用條款，其中規(guī)定了Stable Video Diffusion的預期應用場景（例如“教育或創(chuàng)意工具”、“設計和其他藝術過程”等）以及非預期的場景（例如“對人或事件的事實或真實的表達”）。

Stable Video Diffusion實際上由兩個模型組成：SVD和SVD-XT。SVD可以將靜態(tài)圖片轉(zhuǎn)化為14幀的576×1024像素視頻，而SVD-XT則使用相同的架構，但將幀數(shù)提高到24。兩者都能以每秒3到30幀的速度生成視頻。

根據(jù)Stability AI發(fā)布的白皮書，SVD和SVD-XT最初是在一個包含數(shù)百萬視頻的數(shù)據(jù)集上進行訓練的，然后在一個規(guī)模較小的數(shù)據(jù)集上進行了“微調(diào)”，這個數(shù)據(jù)集只有幾十萬到一百萬左右的視頻片段。雖然這些視頻的來源并不十分清楚，但白皮書暗示許多是來自公開的研究數(shù)據(jù)集，因此無法判斷是否存在版權問題。

盡管Stable Video Diffusion還存在一些局限性，Stability AI對此也很坦誠。例如，這些模型不能生成沒有運動或緩慢攝像機平移的視頻，也不能通過文本進行控制，也不能渲染文字（至少不能清晰地渲染），也不能一致地“正確地”生成人臉和人物。

雖然目前還處于早期階段，但Stability AI指出這些模型非常具有擴展性，可以適應諸如生成物體的360度視圖等用例。最終，Stability AI的目標是將Stable Video Diffusion商業(yè)化，稱其在“廣告、教育、娛樂等領域”都有潛在的應用。這一新穎的AI模型無疑將為視頻生成領域帶來新的可能性。

原創(chuàng)文章，作者：AI，如若轉(zhuǎn)載，請注明出處：http://m.rponds.cn/article/597666.html

AI Stability AI Stable Video Diffusion

AI認證作者

0 0

AI

?Manus官方X賬號突遭凍結后解封，公司緊急辟謠

上周五，中國AI智能體企業(yè)Manus的官方X平臺賬號（@ManusAI_HQ）突然被凍結。聯(lián)合創(chuàng)始人兼首席科學家季逸超（Peak Ji）當日發(fā)布聲明稱，公司正與X平臺支持團隊合作解…

AI
23小時前
產(chǎn)品

?星紀魅族StarV系列智能眼鏡將亮相悉尼支持AI大模型與188英寸巨幕

今日，星紀魅族科技宣布將于3月11日在澳大利亞悉尼舉辦發(fā)布會，正式推出面向海外市場的StarV系列智能眼鏡，包含StarV Air2和StarV View兩款產(chǎn)品。該系列搭載旗艦級…

檸萌
2天前
新聞

美司法部撤回拆分谷歌AI業(yè)務要求維持強制出售Chrome裁決

當?shù)貢r間3月7日（周五），美國司法部向華盛頓聯(lián)邦法院提交文件，宣布不再要求谷歌剝離其在人工智能領域的投資，包括對Anthropic公司的數(shù)十億美元少數(shù)股權。這一調(diào)整源于司法部認為，…

Google
2天前
AI

Manus是什么？揭秘全球首款通用AI代理的顛覆性革命

在科技日新月異的今天，中國初創(chuàng)公司Monica.im（蝴蝶效應科技）憑借其卓越的創(chuàng)新力，推出了全球首款通用型AI代理——Manus。大家都比較好奇Manus為何會如此火爆，那么Ma…

AI
4天前
AI

OpenAI宣布GPT-4.5正式開放，價格是舊版30倍

今日，OpenAI宣布，即日起向所有ChatGPT Plus用戶開放GPT-4.5模型，比原計劃提前兩周落地。此次升級被官方稱為“最接近人類思維的AI系統(tǒng)”，其輸入成本高達GPT-…

AI
5天前
AI

谷歌開源SpeciesNet AI模型：6500萬張圖訓練，2000種物種一鍵辨

近日，谷歌宣布開源人工智能模型SpeciesNet，該工具可通過分析紅外相機陷阱拍攝的照片識別野生動物物種，幫助研究者快速處理海量監(jiān)測數(shù)據(jù)?。 SpeciesNet由谷歌地球外展慈…

AI
6天前
商業(yè)

OpenAI勁敵Anthropic完成35億美E輪融資，估值飆至615億美元

據(jù)外媒報道，被視為OpenAI最強競爭對手的?Anthropic?宣布完成?35億美元（約255.11億元人民幣）E輪融資?，投后估值攀升至?615億美元（約4482.57億元人民…

商業(yè)頭條
6天前
新聞

?蘋果發(fā)布iOS 18.4 Beta 2更新：視覺智能、新表情包、一鍵清空相冊廢紙簍

蘋果向iPhone和iPad用戶推送?iOS/iPadOS 18.4開發(fā)者預覽版Beta 2?（內(nèi)部版本號22E5216h），距離上一版本更新僅隔10天。本次升級涵蓋AI功能增強、…

Apple
2025年3月4日
AI

?DeepSeek R2模型加速來襲，五月前有望提前亮相

近日，據(jù)路透社報道，AI初創(chuàng)公司DeepSeek正在加速推進其R2人工智能模型的發(fā)布進程。據(jù)悉，該模型原本計劃在五月正式推出，但目前DeepSeek方面正在努力加快這一步伐，以期盡…

AI
2025年2月26日
新聞

新加坡最大銀行星展集團裁員：未來三年預計裁員4000人

新加坡最大的銀行——星展銀行（DBS）近日宣布了一項重大人事調(diào)整計劃。由于人工智能（AI）技術的不斷進步，該銀行預計未來三年內(nèi)將裁減約4000名臨時員工和合同工?。據(jù)銀行發(fā)言人表…

檸萌
2025年2月26日
AI

消息稱?即夢AI視頻生成平臺考慮接入DeepSeek

近日，有媒體報道稱，字節(jié)跳動AI視頻生成產(chǎn)品“即夢”正在考慮接入爆火的DeepSeek技術，以進一步提升其視頻生成能力。這一聯(lián)動玩法將為用戶帶來更加精細的視頻創(chuàng)作體驗，例如，用戶可…

AI
2025年2月26日
AI

?消息稱字節(jié)跳動豆包內(nèi)測自研深度思考模型，思維鏈功能初現(xiàn)端倪

今日，有網(wǎng)友驚喜地發(fā)現(xiàn)，字節(jié)跳動旗下的AI助手豆包正在小范圍測試一項全新的深度思考模型。不過，令人意外的是，這次測試并未接入外界熱議的DeepSeek模型，而是采用了字節(jié)跳動自研的…

AI
2025年2月25日
AI

DeepSeek-R1成Hugging Face最受歡迎大模型，超其他150萬模型

今日，AI大模型社區(qū)Hugging Face的聯(lián)合創(chuàng)始人兼CEO Clement Delangue宣布，中國開源大模型DeepSeek-R1在Hugging Face平臺上獲得了超…

AI
2025年2月24日
AI

?傳音Infinix手機迎來AI新升級：DeepSeek-R1滿血版來襲

近日，傳音控股旗下的Infinix品牌宣布正式接入DeepSeek-R1滿血版AI技術。據(jù)悉，從2月26日起，支持XOS 14.5及以上版本的Infinix手機用戶，將能夠通過系統(tǒng)…

野游栗
2025年2月24日
商業(yè)

?DeepSeek官方辟謠：首次融資傳聞不實

近日，市場上流傳著DeepSeek正考慮首次融資的傳聞。然而，從知情人士處獲悉，這一信息并不屬實，“融資相關均為謠言”。 DeepSeek，這家在AI領域迅速崛起的公司，憑借其低成…

AI
2025年2月20日
AI

騰訊微信AI搜索正式灰度測試接入DeepSeek-R1滿血版

近日，騰訊方面?zhèn)鱽碇匕跸?，微信AI搜索正式灰度測試接入DeepSeek-R1滿血版模型，為用戶帶來更加多元化的搜索體驗。這一消息迅速引發(fā)市場關注，騰訊云概念股競價批量漲停，展現(xiàn)出…

AI
2025年2月18日
新聞

Spotify 將推出“Music Pro”訂閱會員，每月額外收取最高5.99美元

近日，據(jù)彭博社報道，音樂流媒體巨頭 Spotify 即將推出一款全新的訂閱會員等級——“Music Pro”。這款訂閱計劃將在現(xiàn)有套餐的基礎上，每月額外收取最高5.99美元（約43…

NEWS
2025年2月18日
新聞

消息稱谷歌AI老將吳永輝轉(zhuǎn)戰(zhàn)字節(jié)跳動，領軍大模型基礎研究新方向

據(jù)多方消息證實，在谷歌任職17年的頂尖AI專家吳永輝博士已正式加入字節(jié)跳動，擔任大模型團隊Seed基礎研究負責人，專注于大模型基礎技術探索及“AI for Science”等長期科…

NEWS
2025年2月18日
新聞

亞馬遜Alexa升級版遇阻：AI答不準，上線推遲至三月

亞馬遜原定于2月26日展示的生成式AI升級版Alexa語音助手，因測試中出現(xiàn)“回答不準確”問題，正式上線時間將推遲至3月31日或更晚。據(jù)《華盛頓郵報》報道，新版Alexa原計劃以免…

校草
2025年2月16日
AI

谷歌Gemini免費版開放文件分析代碼文檔都能傳

谷歌今日宣布，旗下AI助手Gemini即日起向所有免費用戶開放文件上傳及分析功能，此前該服務僅限每月19.99美元（約145元人民幣）訂閱的Gemini Advanced用戶使用?！?/p>

Google
2025年2月15日

發(fā)表回復

登錄后才能評論

Stability AI發(fā)布Stable Video Diffusion模型把靜態(tài)圖片生成高質(zhì)量的視頻

相關推薦

發(fā)表回復