張一鳴的對(duì)手,多了一個(gè)又一個(gè)
作者|馬舒葉 來(lái)源|字母榜(ID:wujicaijing)
進(jìn)入7月,文生視頻賽道動(dòng)作不斷:智譜AI 推出AI生成視頻模型智譜清言,用戶可在30秒內(nèi)免費(fèi)生成6秒視頻;快手可靈迎來(lái)全面開(kāi)放測(cè)試,并正式上線會(huì)員體系,月費(fèi)分為66元、266元和666元三檔。
據(jù)字母榜(ID:wujicaijing)不完全統(tǒng)計(jì),僅國(guó)內(nèi),目前便有超20家公司推出了自研AI視頻產(chǎn)品/模型。非凡產(chǎn)研數(shù)據(jù)顯示,2024年上半年,僅文生視頻領(lǐng)域全球有18次融資活動(dòng),其中12起融資都集中在國(guó)內(nèi)。
在今年2月份Sora震撼發(fā)布前后,前抖音CEO張楠幾乎同期轉(zhuǎn)崗剪映,并表示將推出一個(gè)AI生圖和視頻產(chǎn)品。但近半年過(guò)去,面對(duì)國(guó)內(nèi)其他玩家在成為Sora的“國(guó)產(chǎn)平替”的競(jìng)賽中,字節(jié)在文生視頻領(lǐng)域卻推進(jìn)緩慢。
更糟糕的是,新競(jìng)爭(zhēng)對(duì)手還在不斷趕來(lái)的路上,如今字節(jié)最新的對(duì)手是MiniMax。
接近MiniMax的人士告訴字母榜,如今MiniMax正在內(nèi)部開(kāi)發(fā)視頻大模型,可能會(huì)植入星野AI或海螺AI內(nèi),作為單個(gè)應(yīng)用場(chǎng)景出現(xiàn)。
對(duì)此,MiniMax商業(yè)化負(fù)責(zé)人魏偉回應(yīng)稱(chēng),現(xiàn)在包括MiniMax在內(nèi),各家大模型公司都在做文生視頻的嘗試,但對(duì)MiniMax來(lái)說(shuō),文生視頻的技術(shù)仍在早期階段。目前MiniMax對(duì)AI音頻或AI視頻的推出還沒(méi)有明確計(jì)劃。
作為國(guó)內(nèi)“AI四小龍”之一,MiniMax由閆俊杰創(chuàng)立,3月,MiniMax官宣了由阿里巴巴領(lǐng)投的6億美元,投后估值達(dá)25億美元,根據(jù)非凡產(chǎn)研數(shù)據(jù),6月,MiniMax旗下星野AI的月活為400萬(wàn)人,海螺AI的月活為200萬(wàn)人。
不管是MiniMax、還是智譜AI,切入文生視頻的“軍備競(jìng)賽”,背后都有著對(duì)流量的焦慮。
6月6日,快手的文生視頻大模型可靈發(fā)布,一口氣把視頻生成的時(shí)長(zhǎng)提到了2分鐘級(jí)。上線不到兩月,申請(qǐng)內(nèi)測(cè)可靈的用戶已經(jīng)超過(guò)了70萬(wàn)。而根據(jù)非凡產(chǎn)研數(shù)據(jù),6月,MiniMax旗下海螺AI下降量為176萬(wàn)人,環(huán)比下降19.95%。
盡管非凡產(chǎn)研CEO吳畏表示,整個(gè)6月,聊天類(lèi)AI產(chǎn)品數(shù)據(jù)均有下滑,屬于行業(yè)整體狀況。但對(duì)于MiniMax、智譜AI們而言,無(wú)論是開(kāi)發(fā)自己的視頻大模型,還是將文生視頻作為單個(gè)功能場(chǎng)景插入原本的大模型內(nèi),都不失為一個(gè)引流的優(yōu)選。
引流之外,對(duì)于坐擁短視頻業(yè)務(wù)的字節(jié)而言,文生視頻還將加強(qiáng)剪映等視頻剪輯工具的能力,并有望帶動(dòng)平臺(tái)內(nèi)容供給的豐富度。
面對(duì)各路友商在文生視頻領(lǐng)域的步步緊逼,字節(jié)不得不迎頭跟上。
一
在文生視頻領(lǐng)域效用不顯的大廠,不只有字節(jié)一家。
宣布要“All in AI”的百度,年初推出的AI視頻模型UniVG正在內(nèi)測(cè)階段,阿里達(dá)摩院推出了AI視頻產(chǎn)品“尋光”。
而根據(jù)晚點(diǎn)LatePost報(bào)道,2024年一季度,字節(jié) AI 研發(fā)團(tuán)隊(duì)將視頻生成模型的優(yōu)先級(jí)排在了前面,還挖來(lái)了原Google視頻生成模型VideoPoet項(xiàng)目負(fù)責(zé)人蔣路。2024年1月,字節(jié)推出一款A(yù)I視頻生成工具——MagicVideo-V2,支持從4K到8K的超高分辨率視頻生成。隨后2月,剪映推出名為Dreamina的AI繪畫(huà)工具。3個(gè)月后,剪映Dreamina正式更名為“即夢(mèng)”,上線AI作圖和AI視頻生成功能,生成時(shí)長(zhǎng)為3-12秒。
騰訊不僅自己的AI實(shí)驗(yàn)室推出了視頻生成模型VideoCrafter2,同時(shí)騰訊混元團(tuán)隊(duì)還聯(lián)合中山大學(xué)和香港科技大學(xué)共同研發(fā)了視頻大模型Follow-Your-Pose-v2,上傳一張人物圖片、提供一段動(dòng)作視頻,就能讓圖片人物模仿視頻中的動(dòng)作,視頻可達(dá)10秒。
騰訊集團(tuán)副總裁蔣杰更表示,騰訊混元已支持文生視頻、圖生視頻、圖文生視頻、視頻生視頻等多種視頻生成能力,且已擁有16s視頻生成的能力。
繼Sora激起文生視頻討論熱潮,快手推出可靈,將文生視頻從60秒拉長(zhǎng)到2-3分鐘,文生視頻賽道也引發(fā)了AI創(chuàng)企們的爭(zhēng)奪。
除了MiniMax和智譜AI之外,Morph AI的Morph Studio、愛(ài)詩(shī)科技的PixVerse、MewXAI的藝映AI、右腦科技的Vega AI,雖已經(jīng)在AI視頻領(lǐng)域占據(jù)一席之地,也在不斷迭代產(chǎn)品。
但不是所有大模型企業(yè)都將研發(fā)“國(guó)產(chǎn)Sora”擺在了優(yōu)先戰(zhàn)略級(jí)。
長(zhǎng)文本起家的月之暗面,在OpenAI推出文生視頻模型Sora引發(fā)關(guān)注之際,完成了超10億美元的新一輪融資。當(dāng)同樣由阿里領(lǐng)投的MiniMax已經(jīng)傳出正在研發(fā)視頻大模型的消息時(shí),月之暗面在長(zhǎng)文本之外,仍未有新動(dòng)作傳出。
成立百川智能的搜狗前CEO王小川,更是在3月份一次采訪中表示,百川不走Sora路徑。他認(rèn)為像Sora之類(lèi)的文生視頻模型既不靠近AGI理想,也不靠近現(xiàn)實(shí)場(chǎng)景,Sora的高度、突破性、應(yīng)用價(jià)值都低于GPT。
二
大模型廠商爭(zhēng)卷文生視頻,顯然是因?yàn)榭春肁I視頻“錢(qián)景”。
根據(jù)公開(kāi)數(shù)據(jù),早早在APP里支持“一鍵AI美顏”的美圖,由連年虧損,到2023年總收入27億元,同比增長(zhǎng)29.3%,經(jīng)調(diào)整后歸母凈利潤(rùn)3.7億元,同比增長(zhǎng)233.2%。而這一增長(zhǎng)主要源于AI推動(dòng)主營(yíng)業(yè)務(wù)收入增長(zhǎng),如今美圖用戶每天處理數(shù)億份圖片和視頻,其中約83%都用到了泛AI功能。
以美圖AI口播視頻工具開(kāi)拍為例,面向B端用戶,即抖音、小紅書(shū)、B站上的視頻創(chuàng)作者。“用(開(kāi)拍)來(lái)拍口播可以設(shè)置字幕,濾鏡美顏也會(huì)更自然,甚至美圖還有專(zhuān)門(mén)的APP Wink,恢復(fù)畫(huà)質(zhì)的功能也很好用。”某小紅書(shū)博主告訴字母榜,如今做自媒體,除了剪映之外,美圖的開(kāi)拍、Wink已經(jīng)成了她必用的剪輯工具。
前字節(jié)視覺(jué)技術(shù)負(fù)責(zé)人、愛(ài)詩(shī)科技創(chuàng)始人兼 CEO 王長(zhǎng)虎亦表示,在過(guò)去的移動(dòng)互聯(lián)網(wǎng)時(shí)代,國(guó)民級(jí)產(chǎn)品一定包括抖音、TikTok、快手,視頻相比語(yǔ)言更貼近用戶,未來(lái)產(chǎn)品化和商業(yè)化的可能性更大。
對(duì)于尚在用投流換用戶,仍處在虧損中的AI創(chuàng)企如MiniMax等大模型廠商們來(lái)說(shuō),文生視頻已然成為極具誘惑力的商業(yè)化新場(chǎng)景。
更不用提,上線不到兩月,申請(qǐng)內(nèi)測(cè)可靈的用戶已經(jīng)超過(guò)了70萬(wàn)。在用文生視頻“讓特朗普說(shuō)rap”“讓李白跳抖肩舞”的互聯(lián)網(wǎng)造梗狂歡里,AI視頻正在創(chuàng)造新的流量入口。
對(duì)于需要用日活和下載量證明自己的AI創(chuàng)企而言,社交平臺(tái)的投流成本居高不下,研發(fā)視頻大模型,將文生視頻植入原本的AI工具內(nèi)做流量入口,無(wú)疑會(huì)幫助正在虧損中的大模型初創(chuàng)公司,盡可能壓縮成本。
此外,對(duì)于MiniMax們來(lái)說(shuō),想要承接由于OpenAI禁用API端口調(diào)用而尋找“下家”的B端用戶,不論是用AI生成電商平臺(tái)的門(mén)店物料,還是視覺(jué)創(chuàng)作、商業(yè)攝影、專(zhuān)業(yè)視頻編輯、商業(yè)設(shè)計(jì)等其他領(lǐng)域,文生視頻功能的載入,都能吸引一批“荷包更鼓”的B端用戶。
但對(duì)于“不缺錢(qián)”的互聯(lián)網(wǎng)大廠如字節(jié)等短視頻平臺(tái),“卷”文生視頻賽道,還有著關(guān)乎核心業(yè)務(wù)的重要考量。
在文生視頻領(lǐng)域動(dòng)作頻頻的剪映,既是視頻創(chuàng)作的工具,也和抖音的內(nèi)容生態(tài)息息相關(guān)。而面對(duì)快手可靈的“先發(fā)制人”,美圖開(kāi)拍等APP的緊逼,對(duì)于持續(xù)引導(dǎo)視頻創(chuàng)作者在創(chuàng)作完成后“一鍵發(fā)布到平臺(tái)”的大廠來(lái)說(shuō),對(duì)創(chuàng)作入口的爭(zhēng)奪,直接關(guān)聯(lián)著背后內(nèi)容生態(tài)的建構(gòu)過(guò)程。
此外,無(wú)論是由抖音和博納合作的AI科幻短劇《三星堆:未來(lái)啟示錄》,還是快手原創(chuàng)的AI奇幻短劇《山海奇鏡之劈波斬浪》,對(duì)于巨頭APP如抖音、快手而言,文生視頻的AI技術(shù)也能夠更大程度地豐富平臺(tái)內(nèi)容。
同時(shí),頭豹研究院數(shù)據(jù)顯示,2021年中國(guó)AI視頻生成行業(yè)的市場(chǎng)規(guī)模為800萬(wàn)元,預(yù)計(jì)2026年,這一市場(chǎng)規(guī)模將達(dá)到92.79億元。截至2023年底,該賽道已經(jīng)出現(xiàn)了獨(dú)角獸公司:Midjourney估值100億美元,Stability AI估值40億美元,Runway估值15億美元。而年初爆火出圈的Pika,剛剛成立不到一年,已于6月5日,宣布完成8000萬(wàn)美元B輪融資,估值達(dá)到4.7億美元。
根據(jù)非凡產(chǎn)研數(shù)據(jù),2024年上半年,僅文生視頻領(lǐng)域全球有18次融資活動(dòng),其中12起融資都集中在國(guó)內(nèi),其中愛(ài)詩(shī)科技A輪融資達(dá)1億元,生數(shù)科技A輪融資達(dá)數(shù)億元,千萬(wàn)甚至億級(jí)的融資數(shù)額,也展示了資本市場(chǎng)對(duì)文生視頻的熱切關(guān)注。
需要不斷融資滿足單月百萬(wàn)級(jí)別大模型運(yùn)行費(fèi)用的AI創(chuàng)企,想要把握投資人的心,也需要文生視頻這個(gè)新故事。
三
但想用AI視頻引流、做商業(yè)化,對(duì)資本市場(chǎng)講出新故事,仍面臨重重挑戰(zhàn)。
2月中旬,OpenAI的文生視頻模型Sora引發(fā)熱議,可以生成長(zhǎng)達(dá)1分鐘的流暢視頻,盡管3月OpenAI CTO已透露計(jì)劃“今年晚些時(shí)候”正式推出Sora,但迄今為止,Sora仍未開(kāi)放公測(cè),僅向一些藝術(shù)家定向提供內(nèi)測(cè)。
遲遲不進(jìn)行公測(cè)的Sora,或許指向的正是AI視頻生成的質(zhì)量問(wèn)題。曾擔(dān)任阿里巴巴智能設(shè)計(jì)實(shí)驗(yàn)室負(fù)責(zé)人,打造了AI設(shè)計(jì)平臺(tái)“魯班”的特看科技創(chuàng)始人吳春松(花名樂(lè)乘),也面向國(guó)內(nèi)出海商家和海外本土企業(yè)推出了視頻AIGC生成平臺(tái),他表示,“在產(chǎn)品面向C端用戶的初期,用文生視頻需要嘗試25次,才能生成一次可用的視頻,對(duì)于用戶來(lái)說(shuō),抽卡概率太低。”
B站某UP主則告訴字母榜,如今用國(guó)內(nèi)幾家文生視頻大模型,“想要生成和文字描述準(zhǔn)確的結(jié)果,很多情況下更看運(yùn)氣,嘗試10次下來(lái),調(diào)整后有3-4次能用,就已經(jīng)是技術(shù)做得很不錯(cuò)的模型了。”
為了解決文生視頻質(zhì)量不穩(wěn)定的問(wèn)題,特看科技通過(guò)“文生圖、圖生視頻”的技術(shù)迭代,讓AI視頻生成成功的概率從1/25提升到1/10(生成10次成功1次)。但對(duì)于專(zhuān)業(yè)的視頻創(chuàng)作者來(lái)說(shuō),想要真正地實(shí)現(xiàn)用AI生成可用度較高的商用視頻,就不能只是社交平臺(tái)上風(fēng)靡的“復(fù)活老照片”這類(lèi)簡(jiǎn)單易復(fù)制的操作,對(duì)于AI生成視頻的分鏡、劇情的準(zhǔn)確性,甚至鏡頭效果的美觀程度和一致性,都提出了更高的要求。
反觀現(xiàn)在國(guó)內(nèi)的視頻大模型,即使是在時(shí)長(zhǎng)和準(zhǔn)確度上表現(xiàn)不錯(cuò)的可靈,也因?yàn)?ldquo;平臺(tái)用來(lái)訓(xùn)練模型的基礎(chǔ)語(yǔ)料仍然不夠,跳出擅長(zhǎng)的美食和人像領(lǐng)域,視頻生成的準(zhǔn)確度就會(huì)下降。”
除了生成質(zhì)量不穩(wěn)定之外,文生視頻的商業(yè)化路徑也也并不容易走通。
除了坐擁美圖秀秀這一穩(wěn)定流量入口的美圖,即便是國(guó)內(nèi)的短視頻超級(jí)APP抖音和快手,也尚未打造出破圈的商業(yè)化作品,更多依然是與影視制作團(tuán)隊(duì)的內(nèi)部合作項(xiàng)目。
即便選擇了出海,包括5月在海外用戶量已經(jīng)高達(dá)176萬(wàn)的愛(ài)詩(shī)科技PixVerse、在海外音視頻剪輯領(lǐng)域占據(jù)頭部的字節(jié)Capcut,商業(yè)化路徑也并不明晰。在出海的AI視頻工具內(nèi),只有HeyGen由于為企業(yè)定制營(yíng)銷(xiāo)數(shù)字人視頻,在一年內(nèi)實(shí)現(xiàn)了從100萬(wàn)美元到3500萬(wàn)美元的增長(zhǎng)。
模糊不清的商業(yè)化路徑,加上單月百萬(wàn)級(jí)別的研發(fā)成本,對(duì)于AI大模型廠商們來(lái)說(shuō),文生視頻這場(chǎng)“大考”,恐怕并不好過(guò)。
仍處在賠本賺吆喝階段的文生視頻賽道,某種程度上也給了張一鳴更多追趕的時(shí)間。
編者按:本文轉(zhuǎn)載自微信公眾號(hào):字母榜(ID:wujicaijing),作者:馬舒葉
前瞻經(jīng)濟(jì)學(xué)人
專(zhuān)注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。