2025年Sora視頻引發(fā)行業(yè)變革字節(jié)Boximator備戰(zhàn)AdobeShutterstock受沖擊
Sora新視頻,TikTok獨占
2025年,Sora的新視頻變成了“抖音獨占”。OpenAI剛開的TikTok認證帳號上,悄然更新了不少全新生成視頻,每一個都很有特點,引發(fā)了各路熱議。短短4天,就漲粉10萬,獲贊50萬,這還是在沒怎么宣傳的情況下。a16z合伙人驚嘆,如果這是在信息流里刷出來的,絕對分不出真假。不少人看過很多AI視頻,但都感覺這是一個轉折點。在真實的短視頻消費場景中,Sora與競品的代差明顯,其視頻太逼真,以至于要特別聲明不是真的。OpenAI擔心AI視頻被當真引起不好影響,不遺余力地以各種方式提醒“這是假的!這是假的!”。網(wǎng)友因此發(fā)出預警:從現(xiàn)在開始,在網(wǎng)上看到的一切都值得懷疑,不要相信自己的眼睛。甚至有句話說,“互聯(lián)網(wǎng)時代,沒有人知道你是一條狗?,F(xiàn)在正式升級成‘Sora時代,沒有人知道你是一條不存在的狗’。”
下面再來欣賞幾個“抖音獨占”版Sora視頻:超微距追蹤蟻群,效果堪比紀錄片;以前DALL·E 3畫的靜態(tài)圖被Sora加工一下再配上電音,就成了爆款舞蹈視頻;Sora還特意用一條長達1分24秒的視頻,展示了類似抖音特效的AI視頻編輯能力。這些視頻直接搞得不少短視頻創(chuàng)作者心態(tài)爆炸,甚至連平臺本身都被降維打擊。全球估值第一的獨角獸字節(jié)跳動,與剛剛躍升第三位的OpenAI之間,似乎正醞釀著一場對決。UGC王者和AIGC新貴之間,終有一戰(zhàn)。
“字節(jié)版Sora”也在備戰(zhàn)
在Sora一夜爆火之前,字節(jié)內(nèi)部并不缺乏AI視頻技術。其中一款被傳成是“中國版Sora”的Boximator,其論文在Sora發(fā)布之前就已公布,由字節(jié)AI實驗室總監(jiān)李航領銜。Boximator的功能并非根據(jù)純文字生成視頻,而是按照文字提示將靜態(tài)圖片動態(tài)化。它以字節(jié)2024年11月推出的PixelDance為基礎模型,加入了新的動作設定方式,從圖像中框選物體,然后設置運動終點或直接繪制軌跡,就能對動態(tài)效果進行精細控制。Boximator作為一個插件,與現(xiàn)有的視頻擴散模型結合使用,通過凍結基礎模型的權重,僅訓練控制模塊來實現(xiàn)這一功能。比如,可以通過框框畫畫,讓小哈基米按照一定的軌跡追著球跑。
從效果上看,Boximator雖有bug(飄走的雨傘沒有傘柄),但與Pika 1.0(中)和Gen - 2(右)相比,動畫明顯更加完整,也更接近文字提示。從材質和物理效果上看,Boximator也更勝一籌。在技術層面,Boximator在視頻擴散模型的每個空間注意力塊中增加了一個新的自注意力層,用于處理由對象ID、硬/軟標志和邊界框坐標編碼的控制token。為了簡化學習“框 - 對象”關聯(lián)的挑戰(zhàn),Boximator在訓練過程中還采用了一種稱為自跟蹤(self - tracking)的技術。
那么Boximator到底算不算“字節(jié)版Sora”呢?字節(jié)對此傳聞以辟謠的姿態(tài)回應:Boximator是視頻生成領域控制對象運動的技術方法研究項目,目前還無法作為完善的產(chǎn)品落地,距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。Boximator建立在之前PixelDance(基礎研究)、MagicAnimate(專注于人體動作)等更多字節(jié)團隊研究基礎之上的最新成果??偟膩碚f,這些技術并非針對Sora特意開發(fā),但在AIGC大戰(zhàn)如火如荼的背景之下,仍不失為一種“戰(zhàn)備”。再加上2025年前原抖音CEO張楠卸任,專注于剪映,奔赴AIGC風口??梢哉f雖然Sora的發(fā)布很突然,但字節(jié)并不是毫無準備,或者說早就在業(yè)務推進中感知到了技術趨勢。
視頻編輯、素材站遭殃
Sora的出現(xiàn),給視頻行業(yè)帶來了巨大沖擊。Sora的第一刀,砍向了Adobe。短短5天,Adobe股價跌跌不休,市值蒸發(fā)過百億美元。危機時刻,Adobe剛剛緊急宣布,組建了一個50人的AI研究團隊。然而,這投入的力度沒讓大家看出誠意,29945員工中的50人,只占0.16%。Adobe代表的是沿用近30年的視頻生產(chǎn)、編輯工具,服務于內(nèi)容創(chuàng)作者。不轉型就會變成下一個柯達、諾基亞,但轉型也面臨很大挑戰(zhàn)。比如,Adobe坐擁大量數(shù)據(jù),但要用過去創(chuàng)作者的成果去訓練AI,就會與這些用戶關系緊張。而且,從過去Adobe在AI生圖的表現(xiàn)來看,效果比Midjourney尚有很大差距,如今在AI視頻上又該如何面對OpenAI的技術代差。
除了Adobe,受沖擊第二大的就是素材供應商了,代表公司Shutterstock的日子也不好過。連馬斯克都認同“這個行業(yè)可能消亡”的觀點。不過,Shutterstock也給自己找好了退路,早早與OpenAI簽訂了合作協(xié)議,從素材供應商開始轉型訓練數(shù)據(jù)供應商。這幾天不斷刷屏的Sora視頻中,就有不少Shutterstock圖片的影子。甚至有人開玩笑說,Sora名字四個字母不會就是代表“Shutterstock原創(chuàng),AI攪拌”吧。
(以上信息參考了量子位的相關內(nèi)容以及文中提供的鏈接。隨著AI技術的不斷發(fā)展,視頻行業(yè)正面臨著前所未有的變革。在這個過程中,各個相關方都需要積極應對,尋找新的發(fā)展機遇。比如,對于像Adobe這樣的傳統(tǒng)視頻編輯工具提供商,需要加快轉型步伐,加大在AI技術研發(fā)方面的投入,以適應市場的變化。而對于像Shutterstock這樣的素材供應商,與AI技術公司合作,轉型為訓練數(shù)據(jù)供應商,或許是一個不錯的選擇。對于字節(jié)跳動這樣的行業(yè)巨頭,雖然在AI視頻技術方面有所準備,但也需要不斷創(chuàng)新和完善,以應對來自OpenAI等競爭對手的挑戰(zhàn)??傊贏I時代,只有不斷適應變化,才能在激烈的市場競爭中立于不敗之地。)
版權聲明
風口星內(nèi)容全部來自網(wǎng)絡,版權爭議與本站無關,如果您認為侵犯了您的合法權益,請聯(lián)系我們刪除,并向所有持版權者致最深歉意!本站所發(fā)布的一切學習教程、軟件等資料僅限用于學習體驗和研究目的;不得將上述內(nèi)容用于商業(yè)或者非法用途,否則,一切后果請用戶自負。請自覺下載后24小時內(nèi)刪除,如果您喜歡該資料,請支持正版!