1.了解平臺規(guī)則:
在開始之前,了解轉轉平臺的基本規(guī)則和交易流程,確保你的交易符合平臺政策。
2.選擇要出售的物品:
確定你想要出售的物品,最好是那些容易轉手且有市場需求的物品。
3.評估物品價值:
研究市場上類似物品的售價,合理評估你的物品價值,避免定價過高或過低。
4.準備物品:
清潔和整理你的物品,確保它們處于最佳狀態(tài),以提高吸引力。
5.拍攝高質量照片:
拍攝清晰、多角度的照片,展示物品的細節(jié)和實際狀況,增加買家的興趣。
6.編寫詳細描述:
在商品描述中提供詳盡的信息,包括品牌、型號、使用狀況、功能等,讓買家了解物品的具體情況。
7.設置合理價格:
根據(jù)市場調研和物品狀況,設置一個有競爭力的價格,同時考慮平臺的手續(xù)費。
8.發(fā)布商品:
在轉轉平臺上發(fā)布你的商品,選擇合適的分類和標簽,確保商品能夠被目標買家看到。
9.及時溝通:
及時回復買家的咨詢和出價,保持良好的溝通,提高交易成功率。
10.安排交易:
與買家協(xié)商交易方式,可以選擇線上支付或線下交易。確保交易過程安全、透明。
11.完成交易:
在買家付款后,及時發(fā)貨或安排見面交易,確保買家滿意。
12.確認收款:
確認收到款項后,及時在平臺上確認交易完成,積累好評和信譽。
13.提現(xiàn):
將收到的款項提現(xiàn)到你的銀行賬戶或第三方支付平臺,完成套現(xiàn)過程。
14.持續(xù)優(yōu)化:
根據(jù)交易反饋和市場變化,不斷優(yōu)化你的商品信息和交易策略,提高套現(xiàn)效率。
15.注意安全:
在交易過程中注意個人和財產安全,避免泄露過多個人信息,防范詐騙。
通過這些步驟,你可以在轉轉平臺上更有效地實現(xiàn)套現(xiàn)。同時,建議定期關注平臺的最新政策和市場動態(tài),調整你的策略以適應不斷變化的市場環(huán)境。
----專業(yè)商家提現(xiàn)專號【客服v信1312339978電15873152131】提現(xiàn)秒到賬-----
視頻生成大戰(zhàn)2.0!大廠狂卷底層模型,創(chuàng)企5個月吸金44億
www.163.com 2024-07-24 00:22
智東西(公眾號:
zhidxcom
作者
香草
編輯
李水青
要說2024年大模型最火的賽道,視頻生成一定榜上有名。
繼2月Sora開啟AI視頻生成新時代之后,今年6月密集的模型發(fā)布,又將視頻生成大戰(zhàn)推向了新的高潮。
“AI影視的下一個代際來了”、“太卷了,簡直是你方唱罷我方登場”、“終于有希望擺脫PPT時代了”、“看樣子很快就能用AI制作MV了”……在AI視頻創(chuàng)作者或從業(yè)者當中,我們能看到最多的情緒是“興奮”。
自Sora發(fā)布以來,超8家國內外AI企業(yè)陸續(xù)推出新產品或模型,動輒生成10秒以上視頻且公開可用,有的據(jù)稱已實現(xiàn)長達2分鐘的超長視頻生成,AI視頻生成賽道掀起熱火朝天的2.0大戰(zhàn)。
這邊,字節(jié)搶先上線AI視頻生成產品即夢,將視頻生成時長從常見的3-4秒拉長到12秒;沉寂許久的快手突然發(fā)布可靈大模型,驚艷的效果引發(fā)全網(wǎng)熱議,排隊人數(shù)一度接近100萬。
▲快手可靈排隊申請人數(shù)
那邊,創(chuàng)企Luma AI“棄3D投視頻”,發(fā)布Dream Machine高調入局;老玩家Runway也不甘示弱,甩出新一代Gen-3模型,將物理模擬能力推向新的高度。
▲Gen-3視頻生成效果
融資戰(zhàn)場上,戰(zhàn)火同樣熾烈。國內,愛詩科技、生數(shù)科技自3月起接連斬獲億級融資;海外,Pika在6月獲得8000萬美元融資,估值翻倍至5億美元,而Runway則被曝正在籌備一筆高達4.5億美元的融資。
Sora如同一顆重磅炸彈,震撼了AI視頻生成界。如今經(jīng)過5個月的激烈追趕,海內外AI視頻生成產品究竟進展如何?它們能否與Sora一較高下?又將面臨哪些挑戰(zhàn)?通過對可用產品的橫向體驗,以及與從業(yè)者、創(chuàng)作者的探討,智東西深入分析了這些問題。
在實測中,我能明顯感受到視頻生成的速度變快、“翻車”現(xiàn)象大幅減少,從簡單的“PPT式”平移進化為有角度、動作變化的運動。整體體驗下來,免費可用的產品中效果最佳的是即夢和可靈,無論是時長、穩(wěn)定性還是物理模擬都實現(xiàn)領跑。
在融資方面,與Sora發(fā)布前相比,AI視頻生成相關的融資密度和金額都大幅上漲,5個月內吸金超44億,還帶動視頻制作流程“上下游”的其他產品如AI剪輯、AI燈光等獲得資本青睞。此外還有多個新玩家入局,有的還沒發(fā)布任何產品或技術就已經(jīng)融到億級資金。
一、技術之戰(zhàn):卷時長、卷高清、卷物理模擬
2月16日,OpenAI發(fā)布Sora,一夜顛覆了AI視頻生成賽道格局。然而5個月過去,Sora仍是一款期貨產品,什么時候能為普羅大眾所用,看起來也遙遙無期。
這期間,國內外的大廠、創(chuàng)企爭相發(fā)布新產品或模型升級,且大多數(shù)都已向全體用戶開放,其中不乏效果驚艷的產品,這也讓AI視頻生成的格局再次發(fā)生改變。畢竟,Sora再好,用不上又有什么價值呢?
據(jù)智東西不完全統(tǒng)計,Sora發(fā)布以來國內外至少有8家公司發(fā)布新產品或模型,其中除生數(shù)科技的Vidu之外均公開可用。
▲AI視頻生成產品發(fā)布/模型升級(智東西制表)
2月21日,Stability AI正式上線了AI視頻生成產品Stable Video網(wǎng)頁版,且面向所有用戶開放。雖然其底層模型Stable Video Diffusion于去年11月便已開源發(fā)布,但作為模型仍有一定的部署和使用門檻,打包成網(wǎng)頁版發(fā)布后讓更多用戶可以簡單便捷地上手使用。
4月27日,生數(shù)科技聯(lián)合清華大學發(fā)布長時長、高一致性、高動態(tài)性視頻大模型Vidu,據(jù)稱可生成長達16秒、分辨率1080P的視頻,并且能夠模仿真實物理世界。
從放出的Demo來看,Vidu確實在清晰度、運動幅度、物理模擬等方面取得了很好的效果,不過遺憾的是,Vidu與Sora一樣尚未開放。智東西向生數(shù)科技詢問得知,產品將于近期開啟內測。
▲生數(shù)科技Vidu視頻Demo
5月9日,字節(jié)剪映旗下AI創(chuàng)作平臺Dreamina更名“即夢”,并上線AI作圖和AI視頻生成功能,最長支持生成12秒的視頻。
6月6日,快手發(fā)布AI視頻大模型可靈,并上線快影App,用戶只需填寫問卷即可申請使用??伸`大模型主打對物理世界特性的高強度模擬,例如難倒眾多AI的“吃面條”等問題,在其提供的視頻案例中均有體現(xiàn)。
目前,可靈支持生成5秒、10秒固定時長的視頻。據(jù)其官網(wǎng)介紹,模型最高能生成2分鐘、幀率30fps、分辨率1080P的視頻,后續(xù)將上線視頻續(xù)寫等功能。
6月13日,此前主要做AI生成3D的創(chuàng)企Luma AI宣布推出視頻生成工具Dream Machine,支持文本、圖像生成5秒長度的視頻,同時提供視頻延長功能,可基于已生成的視頻一次延長5秒。
6月17日,Runway發(fā)布新一代模型Gen-3 Alpha版本,并于7月2日面向所有用戶付費開放,訂閱費最低為每月15美元。Gen-3目前支持基于文本生成5秒、10秒長度的視頻,圖生視頻以及其他可控工具暫未開放。
▲Gen-3 Alpha生成視頻效果
7月6日,智象未來(HiDream)在WAIC上發(fā)布了智象大模型2.0,提供5、10、15秒三種視頻生成時長,并增加文字嵌入生成、劇本多鏡頭視頻生成、IP連貫一致性等能力。
7月17日,此前專注AI 3D重建的英國AI創(chuàng)企Haiper AI,宣布旗下AI視頻生成產品Haiper升級至v1.5,時長延長到8秒,且提供視頻延長、畫質增強等功能。
下表展示了這些模型的生成時長、分辨率、幀率等參數(shù),以及除基礎生成外的附加能力。
▲升級的AI視頻生成產品參數(shù)(智東西制表)
從參數(shù)上看,這些AI視頻生成產品首先在生成時長上實現(xiàn)了明顯進步,基礎生成時長從此前的2-4秒延長到5秒,并且有一半以上都支持超10秒的時長,還有部分產品提供了延長功能。目前免費可用的產品中,生成視頻最長的為即夢的12秒。
在視覺效果方面,分辨率、幀率都有較大提升,支持720P及以上的產品更多了,幀率也向24/30fps靠攏,此前的產品生成視頻分辨率大多在1024*576左右,幀率多為8-12fps。
二、產品之戰(zhàn):上手實測6款免費“現(xiàn)貨”,“抖快”領跑
Sora剛發(fā)布時,智東西曾對國內可用的8款AI視頻生成工具進行了深度體驗,當時差距還比較明顯,“翻車”情況較多。(全網(wǎng)首個“中國版Sora”橫評!15家企業(yè)對決,字節(jié)領跑)
那么經(jīng)過幾個月的迭代升級,已經(jīng)交出新答卷的這些玩家表現(xiàn)如何?智東西對新發(fā)布或升級的AI視頻生成產品進行了體驗,為公平起見,統(tǒng)一只試用免費能力,且均選取第一次生成的視頻。
需要注意的是,視頻生成本身就有類似于“抽卡”的運氣成分在內,且和提示詞的撰寫也有很大關系,因此少量的案例并不完全代表模型能力。
第一關我選擇了靜物場景,提示詞為:郁金香沐浴在夕陽暖光中的特寫。
Stable Video在這個提示上表現(xiàn)出很高的穩(wěn)定性,同時畫面清晰度、色彩的豐富程度都比較高,在運動上以鏡頭的運動為主。
圖片加載中…
▲Stable Video生成視頻
Dream Machine的畫面清晰度明顯掉了一個檔次,不過在對提示詞的表現(xiàn)上還是比較準確的,運動同樣以鏡頭的平移為主。
▲Dream Machine生成視頻
Haiper生成的視頻視覺效果很好,但是運動幅度略小。
圖片加載中…
▲Haiper生成視頻
智象大模型的表現(xiàn)也不錯,畫面有很強的景深效果,但細看花瓣會發(fā)現(xiàn)存在細節(jié)上的缺陷和不穩(wěn)定。
圖片加載中…
▲智象大模型生成視頻
即夢生成的是固定鏡頭的畫面,運動方面以郁金香的晃動為主,整體效果比較穩(wěn)定。
圖片加載中…
可靈生成的視頻把“特寫”這一提示詞展現(xiàn)到了極致,同時畫面清晰度較高,還刻畫出了花瓣上的紋理。不過話說回來,對“郁金香的特寫”該如何理解,本身也不是一個有固定答案的問題,所以也說不上誰對誰錯。
//oss.zhidx.com/uploads/2024/07/6696499b734af_6696499b690e6_6696499b690bc_郁金香-可靈.mp4
▲可靈生成視頻
整體來看,各路玩家在靜物場景上的表現(xiàn)都很穩(wěn)定,生成視頻的可用程度很高。
第二關我選擇了動物場景,且增加了風格化和動態(tài)動作的元素,提示詞為:一只卡通袋鼠在跳迪斯科。這其實是Sora提供的案例中的一個,首先我們來看一下Sora的打樣。
//oss.zhidx.com/uploads/2024/07/6696464125de3_6696464116ab1_6696464116a7c_Dancing-kangaroo.mp4
▲Sora生成視頻案例
Stable Video在這一關“撲街”。第一幀畫面很完美——這或許與Stable Video在生成視頻時選取的路徑有關,在生成流程中,它會先生成4張圖像供用戶選擇,再根據(jù)用戶選擇的圖像生成視頻——隨后袋鼠的全身都開始扭曲變形。
比較有趣的是畫面背景中的人物和擬人化的動物并沒有太大的問題,不知道是不是“跳迪斯科”這個動作把Stable Video給難倒了。
▲Stable Video生成視頻效果
Dream Machine生成的視頻整體穩(wěn)定性不錯,但在袋鼠的腳部、手部等細節(jié)上會有穩(wěn)定性的缺失。在運動幅度上,除了袋鼠本身的運動外,它還進行了從特寫到全景的鏡頭推移。
我又試用了Dream Machine的視頻延長功能,視頻后5秒是其延長生成的內容??梢钥吹剿]有局限在單一鏡頭,而是進行了從全身到上半身近景的鏡頭切換。不過延長的視頻中雖然背景中的人物群像穩(wěn)定性較高,但袋鼠更加不穩(wěn)定了。
//oss.zhidx.com/uploads/2024/07/6695ec3b230c2_6695ec3b1f3da_6695ec3b1f39d_A-cartoon-kangaroo-disco-dances.-a318b1.mp4
▲Dream Machine生成視頻效果
Haiper生成的袋鼠有一定程度扭曲,且沒有體現(xiàn)“跳迪斯科”這一關鍵詞。
圖片加載中…
▲Haiper生成視頻
智象大模型在這一關翻車比較嚴重,和Stable Video一樣出現(xiàn)了畫面主體大幅度扭曲的問題,并且也沒有體現(xiàn)“跳迪斯科”。
圖片加載中…
▲智象大模型生成視頻效果
即夢生成的視頻整體視覺效果比較好,清晰度、色彩豐富程度很高。穩(wěn)定性方面,前幾秒還比較正常,但在后3秒左右出現(xiàn)了明顯的扭曲,扭曲程度與Dream Machine差不多。
在語義理解上,畫面有體現(xiàn)一定的“跳舞”動作,但和“迪斯科”關系不大。此外,畫面背景中的文字看起來像是“鬼畫符”。
//oss.zhidx.com/uploads/2024/07/6695ec2b3d230_6695ec2b38b00_6695ec2b38adc_即夢.mp4
▲即夢生成視頻效果
可靈生成的視頻整體比較穩(wěn)定,主要的問題集中在手部和眼球。但在語義理解方面,并沒有體現(xiàn)出“跳迪斯科”這一關鍵詞。
//oss.zhidx.com/uploads/2024/07/669649d2e096d_669649d2dbda7_669649d2dbd80_袋鼠-可靈.mp4
▲可靈生成視頻效果
這一關整體來看,Dream Machine、即夢、可靈的表現(xiàn)更勝一籌,但都無法達到Sora的水準。此外,這個提示詞也展現(xiàn)了各個模型在審美上的差異,包括色彩的傾向、風格的選擇、鏡頭的切換等。
第三關設置為人物特寫,使用的提示詞為:一個宇航員在空間站外漂浮的特寫鏡頭,背景中有地球和月亮,星星在頭盔面罩上反射。
Stable Video在這一關的表現(xiàn)還不錯,準確地描繪了“宇航員”、“地球”、“月亮”、“星星反射”等關鍵詞,穩(wěn)定性也很高。運動方面不是簡單的鏡頭平移,而是畫面主體相對背景的運動。
圖片加載中…
▲Stable Video生成視頻
Dream Machine則大翻車,完全把“宇航員”給丟在了腦后,繪制了一幅宇宙場景。
圖片加載中…
▲Dream Machine生成視頻
Haiper在這一關表現(xiàn)不錯,雖然漏掉了“月亮”,但其他關鍵詞都有體現(xiàn),頭盔中的倒影也很自然。
圖片加載中…
▲Haiper生成視頻
智象大模型起初拒絕生成該提示詞,顯示存在敏感內容。在多次刪減后,我終于用“一個男子在空間站外漂浮的特寫鏡頭”生成了一段視頻。
畫面整體效果比較真實,雖然最終用的提示詞里只有“空間站”這一個體現(xiàn)內容的關鍵詞,其還是描繪了地球、航天服等元素。不過這位主人公并沒有戴航天頭盔,不知道是怎么呼吸甚至講話的(doge)。
圖片加載中…
▲智象大模型生成視頻效果
即夢在人物細節(jié)的刻畫上較為優(yōu)秀,人臉、服裝都比較精致,穩(wěn)定性也很高,但是畫面背景中似乎出現(xiàn)了第二個“地球”,此外鏡頭相較于“特寫”更偏向“近景”。
//oss.zhidx.com/uploads/2024/07/66964f26a7c3e_66964f26a3673_66964f26a3651_宇航員-即夢.mp4
▲即夢生成視頻
可靈生成的視頻畫面中一開始沒有出現(xiàn)人物,隨后宇航員緩慢進入鏡頭當中,但背景又是靜止的,看起來有種淡淡的幽默。不過畫面本身的準確度和穩(wěn)定性還是很高的,體現(xiàn)了每一個關鍵詞,還描繪了部分選手遺漏的“空間站”。
//oss.zhidx.com/uploads/2024/07/66965077c3056_66965077be925_66965077be8fa_宇航員-可靈.mp4
▲可靈生成視頻
人物關的整體表現(xiàn)雖然不如靜物場景穩(wěn)定,但相比上一關效果好了不少,可能和訓練數(shù)據(jù)豐富、運動幅度小有關系。這一關表現(xiàn)更好的是Stable Video、Haiper、即夢和可靈。
總體來看,在智東西本次體驗的6款AI視頻生成產品中,即夢、可靈的生成效果優(yōu)勢比較明顯,無論是在時長還是穩(wěn)定性上都達到不錯的能力。此外國內的Morph Studio、NeverEnds等產品效果也很不錯,但由于其未在Sora發(fā)布后有新的產品或模型升級,因此不在本次體驗范圍內。
三、資本之戰(zhàn):5個月吸金44億,新玩家涌現(xiàn)
Sora發(fā)布時,如當初的GPT-4一樣再度掀起生成式AI熱潮,引發(fā)文生視頻概念股集體漲停。
一級市場也迎來一波新的狂歡。據(jù)智東西不完全統(tǒng)計,Sora發(fā)布至今5個月以來,至少有5家AI視頻生成賽道的創(chuàng)企獲得超億元融資,累計約12億元,此外還有Runway被曝正在洽談4.5億美元(約合人民幣32.68億元)新融資。
▲AI視頻生成相關大額投融資(智東西制表)
國內,愛詩科技分別于3月、4月接連融到兩筆億級資金,且得到螞蟻等知名投資方的青睞,此前其僅在去年8月獲得一筆數(shù)千萬元的天使輪融資。
今年1月,愛詩科技上線海外版AI視頻生成產品PixVerse,當時成為與Pika、Runway競爭的有力黑馬。Sora發(fā)布后,其創(chuàng)始人王長虎曾稱將在3-6個月內實現(xiàn)趕超。
目前5個月過去,愛詩科技尚未發(fā)布底層模型的迭代更新,不過陸續(xù)推出了角色一致性、運動筆刷等新功能。智東西向其詢問產品進展得知,其新一代模型及新功能“文生視頻故事片”將在本周發(fā)布,可生成時長8秒的視頻,并且能一次性生成3-5段內容連續(xù)的有聲視頻。
圖片加載中…
▲PixVerse上線運動筆刷功能(圖源:愛詩科技)
生數(shù)科技也在短短3個月內連續(xù)獲得兩筆數(shù)億元融資,其中百度風投作為老股東持續(xù)加投。此前,生數(shù)科技共獲得2輪累計超一億元融資。
三呆科技(Sand AI)則是一家近期剛剛走入大眾視野的創(chuàng)企,目前并未有產品發(fā)布。7月10日,Sand AI被曝于5月獲得今日資本領投的數(shù)千萬美元A輪融資。
Sand AI成立于2023年10月,主要開發(fā)類似Sora的視頻生成技術。值得注意的是,其創(chuàng)始人曹越是光年之外聯(lián)合創(chuàng)始人之一,曾任北京智源AI研究院視覺模型研究中心負責人、微軟亞洲研究院主管研究員。
公開信息顯示,曹越本科、博士均畢業(yè)于清華大學,曾獲得計算機視覺頂會ICCV的最佳論文獎馬爾獎,谷歌學術被引超4萬次。
▲曹越(圖源其個人主頁)
Haiper AI也是一家新入局視頻生成的創(chuàng)企。該公司成立于2022年,位于英國倫敦,此前專注基于AI的3D重建方向。
據(jù)外媒3月報道,Haiper AI獲得1380萬美元(約合人民幣1億元)的種子輪融資,此前曾于2022年4月籌集了540萬美元資金。
Haiper AI的創(chuàng)始團隊是兩位華人,Yishu Miao曾在TikTok全球信任與安全團隊任職,Ziyu Wang曾在DeepMind擔任研究科學家。去年晚些時候,Haiper AI團隊決定專注于視頻生成,并在去年12月發(fā)布了首款同名視頻生成產品的測試版。
圖片加載中…
▲Haiper發(fā)布同名產品測試版
Pika于6月宣布獲得新一輪約8000萬美元(約合人民幣5.81億元)融資,估值翻倍至近5億美元。去年11月,Pika宣布完成累計完成5500萬美元的融資,估值在2-3億美元。
7月2日,AI視頻生成賽道的“老玩家”Runway被曝出正在洽談4.5億美元(約合人民幣32.68億元)的新融資,估值達到40億美元。
Runway的上一筆融資完成于去年6月,投資方包括谷歌、英偉達等,并以1.41億美元的資金達到15億美元融資,累計融資2.37億美元。如果本輪融資落地,無論是融資額還是估值都達到兩倍以上。
總的來看,在Sora發(fā)布后的這幾個月,一級市場不斷有新的AI視頻生成融資出現(xiàn),不僅頻率更加頻繁,金額也大幅上漲,單次融資額都超過此前的融資總額。即使部分創(chuàng)企沒有產品發(fā)布或模型升級,也沒能阻擋投資方的熱情。
四、AI視頻大戰(zhàn)150天,從“PPT”變成真正的“視頻”
Sora“隱身”的150天,在眾多大廠和創(chuàng)企的“圍攻”下,主流AI視頻生成產品與Sora的差距已經(jīng)大幅縮短,并且還有至關重要的一點——可上手使用,甚至不少功能還是免費。
目前來看,頭部AI視頻生成產品已經(jīng)實現(xiàn)了不錯的時長和穩(wěn)定性,下一步迭代的重點方向是物理模擬。從官方展示的Demo來看,Gen-3、可靈、即夢、Vidu對真實世界的模擬程度較高,經(jīng)過篩選過的案例已經(jīng)與Sora放出的案例效果相差無幾。
那么從創(chuàng)作者的視角來看,現(xiàn)階段的產品使用體驗如何呢?
近日,導演、AI影視創(chuàng)作者陳坤(閑人一坤)制作了其AI短劇《山海奇鏡》預告片的重制版,并與原版進行了對比。
在該短劇的首映會上,他向智東西等媒體談道,半年時間內AI的進步還是非常明顯的,尤其是物理模擬方面,在他看來已經(jīng)實現(xiàn)了“代際性”的迭代。具體來說,現(xiàn)階段可靈等視頻生成模型已經(jīng)實現(xiàn)了原生高清,不再是切片式的畫面內容驅動,主體運動合理,動作幅度不但大還流暢,且對提示詞響應積極。但同時,現(xiàn)在AI視頻生成技術仍面臨幾大痛點:人物一致性、場景一致性、人物表演、動作交互、運動幅度。
圖片加載中…
▲《山海奇鏡》預告片重制版與原版對比
從應用的角度來看,在影視制作等場景中,AI目前還處于追趕傳統(tǒng)影視的過程中。
在一個完整的制作流程中,AI仍是一個輔助的手段而非主要工具,如劇本、配音、剪輯、后期等環(huán)節(jié),目前還沒有能達到生產力水準的產品出現(xiàn)。
但在成本上,包括人效比等方面,基于AI的流程已經(jīng)實現(xiàn)大幅壓縮,達到傳統(tǒng)制作流程的1/4以下。
圖片加載中…
▲陳坤在點映會上接受采訪
在WAIC 2024上,愛詩科技聯(lián)合創(chuàng)始人謝旭璋談道,現(xiàn)在我們所說的“視頻生成”其實只是視頻素材的生成,只是完整視頻制作流程中的一小部分,沒有聲音、剪輯、轉場、劇本等,無論是從技術還是業(yè)務上,還有非常長的路要走。
這也是除了繼續(xù)迭代底層模型克服視頻生成現(xiàn)有痛點外,AI視頻發(fā)展的另一重要方向。
市面上也有不少公司正在各個視頻制作流程中進行嘗試,同樣得到一級市場的青睞。僅最近一周內,就有AI驅動的視頻編輯工具Captions、AI虛擬環(huán)境提供照明和合成工具Beeble分別獲得6000萬美元和475萬美元融資。
結語:AI視頻生成,等待一個GPT-4時刻
Sora的發(fā)布點燃了國內外大廠團隊和創(chuàng)業(yè)者的熱情,不過整體來看還處于早期階段,技術路線尚未達成共識,生成效果離商業(yè)標準也有一定距離。至于具體處在什么階段,有不少行業(yè)人士將其與語言、圖像模型的早期階段作類比,如“GPT-3時代”、“圖像生成的2022年前夕”等。
但可以肯定的是,AI視頻生成技術正在指數(shù)級飛速發(fā)展,不斷有新的產品和技術問世。盡管存在一些技術痛點和挑戰(zhàn),但隨著技術的迭代和市場的推動,這一領域有望實現(xiàn)更多的突破和應用。
AI視頻生成大戰(zhàn)不僅是技術的較量,更是資本的角逐。在這場狂卷吸金的風暴中,誰能笑到最后,我們拭目以待。