在ChatGPT問世一年多后,OpenAI公司近期再次出招,推出文生視頻大模型Sora。根據(jù)簡(jiǎn)單的文本指令,Sora就能生成一段60秒的視頻,其中包含多角度鏡頭切換,呈現(xiàn)相當(dāng)豐富的細(xì)節(jié),等等。OpenAI官網(wǎng)發(fā)布了多個(gè)視頻示例,逼真的畫面令人很難區(qū)分它們是由實(shí)拍而得,還是由AI生成。
Sora的現(xiàn)身一時(shí)間引發(fā)熱議。部分業(yè)內(nèi)人士稱其“比想象中來得更快”,是“人工智能領(lǐng)域的一次突破”;也有一些網(wǎng)友緊張了起來,比如有人擔(dān)心,有了Sora的加持,影視、傳媒、廣告等文化產(chǎn)業(yè)將受沖擊,進(jìn)而產(chǎn)生了“飯碗焦慮”。
不禁要問,Sora究竟是什么?如果普遍使用的話,它將給文化產(chǎn)業(yè)及其從業(yè)者帶來什么?
Sora生成的視頻圖像:一杯咖啡中,兩艘海盜船展開了“戰(zhàn)斗” 圖源:OpenAI官網(wǎng)
一
Sora并不是文生視頻領(lǐng)域的第一個(gè)“吃螃蟹者”。此前,Runway、Pika等公司也曾推出文生視頻模型。那么,“后來者”Sora為啥能“居上”?
“大片質(zhì)感”。有人評(píng)價(jià),由Sora生成的視頻,無論是光影色彩的轉(zhuǎn)變,還是鏡頭移動(dòng),甚至細(xì)微到紋理結(jié)構(gòu)變化,都呈現(xiàn)出較高質(zhì)感。它還能模擬現(xiàn)實(shí)世界的物理規(guī)律,像“一杯咖啡中,兩艘海盜船展開了激烈的戰(zhàn)斗”這段視頻,不僅呈現(xiàn)了咖啡的流體動(dòng)力學(xué)和逼真的光影渲染,還運(yùn)用了光線追蹤和移軸攝影技術(shù)等,技能強(qiáng)大。
“時(shí)長(zhǎng)感人”。此前,谷歌、Runway等推出的大模型,每次生成的視頻最多只能達(dá)到10多秒的時(shí)長(zhǎng)。而Sora則將視頻長(zhǎng)度拉長(zhǎng)到了60秒,這一突破意味著,由其生成的視頻信息承載力更強(qiáng)、內(nèi)容更豐富,達(dá)到了很多短視頻平臺(tái)的內(nèi)容發(fā)布要求。
“匹配自如”。Sora不僅能讓文字迅速成片,而且能根據(jù)情況生成與各種設(shè)備匹配的畫面,寬屏視頻、豎屏視頻以及其他比例的視頻,都能得到匹配。這也使得Sora能適應(yīng)不同設(shè)備,滿足各類用戶的觀看需求。
此外,據(jù)分析,Sora在細(xì)節(jié)處理、語言理解能力、視頻擴(kuò)展功能等方面的表現(xiàn)也較為顯眼,這些也正是“后來者”Sora能夠突出重圍的原因。
二
需要看到,作為生成式AI模型的一顆“新星”,Sora并不算完美,仍存在一些不成熟之處,比如邏輯性還有待提升,在更精細(xì)內(nèi)容的調(diào)控方面有待加強(qiáng)。但它的出現(xiàn),已經(jīng)給大眾帶來了一定的想象空間。
對(duì)文化產(chǎn)業(yè)而言,“新物種”Sora如果能夠進(jìn)一步被使用,或許能帶來不一般的能量。比如,在內(nèi)容供給端,有業(yè)內(nèi)人士就認(rèn)為,Sora會(huì)像當(dāng)年的智能手機(jī)一樣,降低內(nèi)容創(chuàng)作者門檻,從而使內(nèi)容供給更加豐富。
對(duì)影視產(chǎn)業(yè)來說,Sora似乎已經(jīng)可以“承包”部分?jǐn)z影、導(dǎo)演、剪輯等任務(wù),那么當(dāng)它進(jìn)一步升級(jí)后,影響的或許將不只是短視頻。盡管Sora發(fā)布的視頻示例中,時(shí)間最長(zhǎng)的只有60秒,但按照AI大模型等技術(shù)日新月異的迭代速度,生產(chǎn)出優(yōu)質(zhì)的AI長(zhǎng)視頻似乎指日可待。當(dāng)然,這一角色,除了Sora,也可以是其他的大模型。
Sora生成的視頻圖像:一輛老式SUV行駛在盤山公路上 圖源:OpenAI官網(wǎng)
這一技術(shù)也可以應(yīng)用到廣告業(yè)領(lǐng)域。像OpenAI發(fā)布的一個(gè)視頻示例就呈現(xiàn)了這樣的畫面,“一輛老式SUV行駛在盤山公路上,揚(yáng)起的灰塵在溫暖的陽光下清晰可見,路兩邊的丘陵上種滿了紅杉樹”??梢韵胂?,未來的汽車廣告、美食廣告、景點(diǎn)宣傳視頻等一些不需要特別復(fù)雜情節(jié)的廣告視頻,或許就能夠借助它來完成。
此外,于新聞傳媒業(yè)而言,諸如Sora這樣的視頻生成器的使用,也會(huì)對(duì)目前的新聞生產(chǎn)方式和流程等產(chǎn)生一定的重構(gòu)性作用。
當(dāng)然,文生視頻大模型的出現(xiàn)也令人喜憂參半。比如一些文化產(chǎn)業(yè)相關(guān)從業(yè)者就開始擔(dān)心,Sora是否可能搶了自己的“飯碗”。目前網(wǎng)絡(luò)上相關(guān)討論當(dāng)中,這是主要話題之一。
還有一些網(wǎng)友擔(dān)憂,在未來,假新聞是否會(huì)因此而更泛濫?此前就有人曾利用ChatGPT將搜集到的一些素材修改編輯后,當(dāng)成新聞報(bào)道發(fā)布在互聯(lián)網(wǎng)上,編造假新聞牟利。此外,這種逼真的視頻生成技術(shù)還可能被用于制作“深度偽造”視頻,一旦被犯罪分子利用,將帶來較大風(fēng)險(xiǎn)。
圖源:視覺中國
三
技術(shù)浪潮下的文化產(chǎn)業(yè),重塑與變革必然勢(shì)不可當(dāng),正如蒸汽機(jī)、發(fā)電機(jī)等機(jī)器工具的發(fā)明和普及,讓手工勞動(dòng)被自動(dòng)化機(jī)器代替。隨著Sora及其他一些大模型的逐步開放和商用,文化產(chǎn)業(yè)中部分重復(fù)性的、缺少技術(shù)含量的勞動(dòng)有較大可能會(huì)被取代。
換言之,無論是ChatGPT還是Sora,技術(shù)進(jìn)步更重要的意義,在于讓更多人可以不被簡(jiǎn)單重復(fù)的勞動(dòng)所束縛,從而去創(chuàng)造更大價(jià)值。文化產(chǎn)業(yè)想要制勝未來,不能逃避而只能主動(dòng)擁抱人工智能新浪潮。那么,如何讓生成式AI技術(shù)的“洪荒之力”為我們所用?
與AI成為工作“搭子”。生成式AI所蘊(yùn)含的深層次、革命性力量是不容低估的,與其揣著“飯碗焦慮”,我們不如將之視為工作的“搭子”,利用它幫助自己更高效地實(shí)現(xiàn)創(chuàng)意轉(zhuǎn)化、精品打造等。
比如,真實(shí)是新聞報(bào)道的生命,生成式AI不能完成紀(jì)實(shí)性內(nèi)容的采集和拍攝,但利用好這一技術(shù),是否可以快速生成動(dòng)畫、圖表,使得報(bào)道更生動(dòng)、內(nèi)容更可讀?對(duì)影視產(chǎn)業(yè)來說,利用該技術(shù)降低影視特效生成難度,一些高風(fēng)險(xiǎn)、拍攝難度系數(shù)較大的鏡頭和畫面可用它來生成。
把好內(nèi)容安全的“方向盤”。生成式AI是基于現(xiàn)有數(shù)據(jù)基礎(chǔ)的“演繹”,如果現(xiàn)有“訓(xùn)練資料”有問題,則產(chǎn)生的內(nèi)容也容易受到影響,出現(xiàn)偏差。因此,進(jìn)一步完善內(nèi)容審核機(jī)制,確保AI生成的文字、圖片和視頻等內(nèi)容導(dǎo)向正確、合法合規(guī),還需要繼續(xù)探索。同時(shí),也有必要積極開發(fā)運(yùn)用相應(yīng)AI輔助工具,及時(shí)篩選存在問題的內(nèi)容,有效防范虛假、違規(guī)等內(nèi)容的傳播風(fēng)險(xiǎn)。
讓技術(shù)與文化“共舞”。文化產(chǎn)業(yè)要更好接駁這一波風(fēng)口,既要有技術(shù)的“強(qiáng)支撐”,讓生成式AI發(fā)揮好“聰明才智”,也要有文化的“強(qiáng)底座”,讓數(shù)字技術(shù)與文化創(chuàng)新發(fā)展共融共舞,催生產(chǎn)業(yè)新活力。比如,運(yùn)用AI技術(shù)生成虛擬數(shù)字人,在各大景區(qū)景點(diǎn)、文博場(chǎng)館化身傳統(tǒng)文化“導(dǎo)游”,與觀眾進(jìn)行穿越時(shí)空的對(duì)話,帶來沉浸式新體驗(yàn)。
有人說,就像寶劍從屬于俠客一樣,無論人工智能發(fā)展到何種程度,它始終根源于人類的創(chuàng)造,也始終是人類智慧的延伸。不妨對(duì)AI技術(shù)的發(fā)展寄予美好的期盼,也對(duì)未來人類與AI的和諧相處、攜手共進(jìn)抱有更多信心。
在ChatGPT問世一年多后,OpenAI公司近期再次出招,推出文生視頻大模型Sora。根據(jù)簡(jiǎn)單的文本指令,Sora就能生成一段60秒的視頻,其中包含多角度鏡頭切換,呈現(xiàn)相當(dāng)豐富的細(xì)節(jié),等等。OpenAI官網(wǎng)發(fā)布了多個(gè)視頻示例,逼真的畫面令人很難區(qū)分它們是由實(shí)拍而得,還是由AI生成。
Sora的現(xiàn)身一時(shí)間引發(fā)熱議。部分業(yè)內(nèi)人士稱其“比想象中來得更快”,是“人工智能領(lǐng)域的一次突破”;也有一些網(wǎng)友緊張了起來,比如有人擔(dān)心,有了Sora的加持,影視、傳媒、廣告等文化產(chǎn)業(yè)將受沖擊,進(jìn)而產(chǎn)生了“飯碗焦慮”。
不禁要問,Sora究竟是什么?如果普遍使用的話,它將給文化產(chǎn)業(yè)及其從業(yè)者帶來什么?
Sora生成的視頻圖像:一杯咖啡中,兩艘海盜船展開了“戰(zhàn)斗” 圖源:OpenAI官網(wǎng)
一
Sora并不是文生視頻領(lǐng)域的第一個(gè)“吃螃蟹者”。此前,Runway、Pika等公司也曾推出文生視頻模型。那么,“后來者”Sora為啥能“居上”?
“大片質(zhì)感”。有人評(píng)價(jià),由Sora生成的視頻,無論是光影色彩的轉(zhuǎn)變,還是鏡頭移動(dòng),甚至細(xì)微到紋理結(jié)構(gòu)變化,都呈現(xiàn)出較高質(zhì)感。它還能模擬現(xiàn)實(shí)世界的物理規(guī)律,像“一杯咖啡中,兩艘海盜船展開了激烈的戰(zhàn)斗”這段視頻,不僅呈現(xiàn)了咖啡的流體動(dòng)力學(xué)和逼真的光影渲染,還運(yùn)用了光線追蹤和移軸攝影技術(shù)等,技能強(qiáng)大。
“時(shí)長(zhǎng)感人”。此前,谷歌、Runway等推出的大模型,每次生成的視頻最多只能達(dá)到10多秒的時(shí)長(zhǎng)。而Sora則將視頻長(zhǎng)度拉長(zhǎng)到了60秒,這一突破意味著,由其生成的視頻信息承載力更強(qiáng)、內(nèi)容更豐富,達(dá)到了很多短視頻平臺(tái)的內(nèi)容發(fā)布要求。
“匹配自如”。Sora不僅能讓文字迅速成片,而且能根據(jù)情況生成與各種設(shè)備匹配的畫面,寬屏視頻、豎屏視頻以及其他比例的視頻,都能得到匹配。這也使得Sora能適應(yīng)不同設(shè)備,滿足各類用戶的觀看需求。
此外,據(jù)分析,Sora在細(xì)節(jié)處理、語言理解能力、視頻擴(kuò)展功能等方面的表現(xiàn)也較為顯眼,這些也正是“后來者”Sora能夠突出重圍的原因。
二
需要看到,作為生成式AI模型的一顆“新星”,Sora并不算完美,仍存在一些不成熟之處,比如邏輯性還有待提升,在更精細(xì)內(nèi)容的調(diào)控方面有待加強(qiáng)。但它的出現(xiàn),已經(jīng)給大眾帶來了一定的想象空間。
對(duì)文化產(chǎn)業(yè)而言,“新物種”Sora如果能夠進(jìn)一步被使用,或許能帶來不一般的能量。比如,在內(nèi)容供給端,有業(yè)內(nèi)人士就認(rèn)為,Sora會(huì)像當(dāng)年的智能手機(jī)一樣,降低內(nèi)容創(chuàng)作者門檻,從而使內(nèi)容供給更加豐富。
對(duì)影視產(chǎn)業(yè)來說,Sora似乎已經(jīng)可以“承包”部分?jǐn)z影、導(dǎo)演、剪輯等任務(wù),那么當(dāng)它進(jìn)一步升級(jí)后,影響的或許將不只是短視頻。盡管Sora發(fā)布的視頻示例中,時(shí)間最長(zhǎng)的只有60秒,但按照AI大模型等技術(shù)日新月異的迭代速度,生產(chǎn)出優(yōu)質(zhì)的AI長(zhǎng)視頻似乎指日可待。當(dāng)然,這一角色,除了Sora,也可以是其他的大模型。
Sora生成的視頻圖像:一輛老式SUV行駛在盤山公路上 圖源:OpenAI官網(wǎng)
這一技術(shù)也可以應(yīng)用到廣告業(yè)領(lǐng)域。像OpenAI發(fā)布的一個(gè)視頻示例就呈現(xiàn)了這樣的畫面,“一輛老式SUV行駛在盤山公路上,揚(yáng)起的灰塵在溫暖的陽光下清晰可見,路兩邊的丘陵上種滿了紅杉樹”。可以想象,未來的汽車廣告、美食廣告、景點(diǎn)宣傳視頻等一些不需要特別復(fù)雜情節(jié)的廣告視頻,或許就能夠借助它來完成。
此外,于新聞傳媒業(yè)而言,諸如Sora這樣的視頻生成器的使用,也會(huì)對(duì)目前的新聞生產(chǎn)方式和流程等產(chǎn)生一定的重構(gòu)性作用。
當(dāng)然,文生視頻大模型的出現(xiàn)也令人喜憂參半。比如一些文化產(chǎn)業(yè)相關(guān)從業(yè)者就開始擔(dān)心,Sora是否可能搶了自己的“飯碗”。目前網(wǎng)絡(luò)上相關(guān)討論當(dāng)中,這是主要話題之一。
還有一些網(wǎng)友擔(dān)憂,在未來,假新聞是否會(huì)因此而更泛濫?此前就有人曾利用ChatGPT將搜集到的一些素材修改編輯后,當(dāng)成新聞報(bào)道發(fā)布在互聯(lián)網(wǎng)上,編造假新聞牟利。此外,這種逼真的視頻生成技術(shù)還可能被用于制作“深度偽造”視頻,一旦被犯罪分子利用,將帶來較大風(fēng)險(xiǎn)。
圖源:視覺中國
三
技術(shù)浪潮下的文化產(chǎn)業(yè),重塑與變革必然勢(shì)不可當(dāng),正如蒸汽機(jī)、發(fā)電機(jī)等機(jī)器工具的發(fā)明和普及,讓手工勞動(dòng)被自動(dòng)化機(jī)器代替。隨著Sora及其他一些大模型的逐步開放和商用,文化產(chǎn)業(yè)中部分重復(fù)性的、缺少技術(shù)含量的勞動(dòng)有較大可能會(huì)被取代。
換言之,無論是ChatGPT還是Sora,技術(shù)進(jìn)步更重要的意義,在于讓更多人可以不被簡(jiǎn)單重復(fù)的勞動(dòng)所束縛,從而去創(chuàng)造更大價(jià)值。文化產(chǎn)業(yè)想要制勝未來,不能逃避而只能主動(dòng)擁抱人工智能新浪潮。那么,如何讓生成式AI技術(shù)的“洪荒之力”為我們所用?
與AI成為工作“搭子”。生成式AI所蘊(yùn)含的深層次、革命性力量是不容低估的,與其揣著“飯碗焦慮”,我們不如將之視為工作的“搭子”,利用它幫助自己更高效地實(shí)現(xiàn)創(chuàng)意轉(zhuǎn)化、精品打造等。
比如,真實(shí)是新聞報(bào)道的生命,生成式AI不能完成紀(jì)實(shí)性內(nèi)容的采集和拍攝,但利用好這一技術(shù),是否可以快速生成動(dòng)畫、圖表,使得報(bào)道更生動(dòng)、內(nèi)容更可讀?對(duì)影視產(chǎn)業(yè)來說,利用該技術(shù)降低影視特效生成難度,一些高風(fēng)險(xiǎn)、拍攝難度系數(shù)較大的鏡頭和畫面可用它來生成。
把好內(nèi)容安全的“方向盤”。生成式AI是基于現(xiàn)有數(shù)據(jù)基礎(chǔ)的“演繹”,如果現(xiàn)有“訓(xùn)練資料”有問題,則產(chǎn)生的內(nèi)容也容易受到影響,出現(xiàn)偏差。因此,進(jìn)一步完善內(nèi)容審核機(jī)制,確保AI生成的文字、圖片和視頻等內(nèi)容導(dǎo)向正確、合法合規(guī),還需要繼續(xù)探索。同時(shí),也有必要積極開發(fā)運(yùn)用相應(yīng)AI輔助工具,及時(shí)篩選存在問題的內(nèi)容,有效防范虛假、違規(guī)等內(nèi)容的傳播風(fēng)險(xiǎn)。
讓技術(shù)與文化“共舞”。文化產(chǎn)業(yè)要更好接駁這一波風(fēng)口,既要有技術(shù)的“強(qiáng)支撐”,讓生成式AI發(fā)揮好“聰明才智”,也要有文化的“強(qiáng)底座”,讓數(shù)字技術(shù)與文化創(chuàng)新發(fā)展共融共舞,催生產(chǎn)業(yè)新活力。比如,運(yùn)用AI技術(shù)生成虛擬數(shù)字人,在各大景區(qū)景點(diǎn)、文博場(chǎng)館化身傳統(tǒng)文化“導(dǎo)游”,與觀眾進(jìn)行穿越時(shí)空的對(duì)話,帶來沉浸式新體驗(yàn)。
有人說,就像寶劍從屬于俠客一樣,無論人工智能發(fā)展到何種程度,它始終根源于人類的創(chuàng)造,也始終是人類智慧的延伸。不妨對(duì)AI技術(shù)的發(fā)展寄予美好的期盼,也對(duì)未來人類與AI的和諧相處、攜手共進(jìn)抱有更多信心。
本文鏈接:http://www.3ypm.com.cn/news-2-1646-0.htmlSora將改寫什么
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
上一篇:高枕并非無憂!新研究顯示枕頭過高對(duì)人體有風(fēng)險(xiǎn)
下一篇:巨頭出手!科技圈又爆了!
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“”按鈕