文 | 互聯(lián)網(wǎng)江湖,作者 | 劉致呈
有一陣子沒聊 AI 了,趁著最有時間,有點看法想跟大家交流。
DeepSeek 誕生之后,各個行業(yè)朝氣蓬勃,百度把 DeepSeek 做進了搜索,騰訊把大模型做進了微信,各種行業(yè),各種產(chǎn)品都用上了語言大模型。
一場 AI 革命,已然發(fā)生了。
前十年,移動互聯(lián)網(wǎng)時代掀起的流量革命,一開始是圖文,然后就是視頻。十年之后的今天,快手、抖音成了全網(wǎng)最大的 " 注意力黑洞 ",虹吸著流量和以流量為生的業(yè)態(tài)。
往后看十年,AI 亦如是。
DeepSeek 改變了圖文交互、語言交互,今天的 AI 正在改變視頻交互。
從 AI 生文、AI 生圖再到大模型生成視頻,這一進化符合邏輯,也順應(yīng)歷史周期。問題是,新的周期之下,這場 AI 革命將由誰主導?
快手、抖音:天下英雄 " 惟使君與操耳 "。
今天的視頻大模型玩家,大概有這么幾類:
第一類是巨頭。
比如,騰訊混元視頻大模型、阿里通義萬相。
巨頭布局文生視頻,本質(zhì)上是布局入口,同時為未來業(yè)務(wù)端的需求做技術(shù)儲備。
騰訊做文生視頻,可以給視頻號做能力儲備,一旦有了真正需求,現(xiàn)成的模型就能拿來用,阿里也是一樣,淘寶越來越內(nèi)容化,文生視頻這個能力是留個后手。
符合大廠一貫的做派,我可以不用,但每個入口都要布局,每個能力都要面面俱到。如果賽道里有人跑通了,那就砸資源跟進。
語言大模型上,騰訊不也是觀望了很久,直到 DeepSeek 出世,直接整合進微信,摘了最大的果子。
第二類,是 AI 公司。
比如,商湯科技的 V-ME,科大訊飛的訊飛繪鏡。
這些 AI 公司,囿于自身的實力以及資源限制,能夠在文生視頻上投入的資源并不多,更多的精力其實還是在自身業(yè)務(wù)。做大主營業(yè)務(wù)是核心 KPI。做視頻大模型,陪跑的概率很大。
第三:短視頻平臺。
短視頻平臺核心就兩家:快手、抖音。
先來說快手。
最近,市面上有這么一則消息:快手成立了可靈 AI 事業(yè)部。快手高級副總裁蓋坤擔任可靈 AI 事業(yè)部負責人,AI 戰(zhàn)略在快手內(nèi)部提升至最高級別。
這動作是什么意思呢?
槍擦完了子彈上膛,玩兒真的了。
快手可靈 AI 增長是很猛的。今年 2 月份可靈 AI 累計營業(yè)收入已超過 1 億元,今年前三個月,可靈 AI 營收超過了 2024 年總和。商業(yè)化這塊兒,可靈 AI 很有爆發(fā)力。
快手可靈 AI 生成的視頻質(zhì)量很高,可靈 AI2.0 的產(chǎn)品能力已經(jīng)追平甚至部分超過 Sora。目前定位于生產(chǎn)力工具。
生產(chǎn)力技術(shù)是最容易變現(xiàn)的。
AI 的路線上,快手走的是當年微軟走過的路子。
AI 這樣的技術(shù),就是新時代的 office,當年微軟靠著 office 、Windows 掙得盆滿缽滿,就是因為軟件作為生產(chǎn)力是一種剛需。
視頻大模型,只有先把生產(chǎn)力變現(xiàn)的邏輯跑通了,才能支撐后續(xù)源源不斷迭代。所以,快手內(nèi)部會上,蓋坤也提到要優(yōu)先保證模型效果,聚焦 professional creators。
好產(chǎn)品是不缺用戶的。
可靈 AI 這一億的營收背后是 2200 萬用戶,1.5 萬開發(fā)者和企業(yè)客戶貢獻的。后續(xù)還會有多少付費用戶,且看快手后續(xù)財報。
只是,這一個億就像是一個標桿,后續(xù)視頻大模型能不能觸及商業(yè)化這個條線,一個小目標就是個重要的參考系。
與快手不同,抖音走的是另一條路。
最近,豆包大模型團隊組建了 AGI 長期研究團隊,還發(fā)布 Seaweed-7B 模型,號稱能在 25 秒內(nèi)生成高質(zhì)量視頻。可見在視頻大模型上,抖音還是聚焦技術(shù)。
相比快手可靈 AI,字節(jié)即夢在視頻生成效果上略顯粗糙,但體驗門檻低。這反映出團隊還在繼續(xù)打磨技術(shù)產(chǎn)品,并希望通過降低門檻,來把流量池做起來。
字節(jié)的優(yōu)勢是用戶流量池很大,做 AI 也是復制過去成功的路徑。當年抖音做起來,也是走的這個路子。
如今 APP 工廠的優(yōu)勢還在延續(xù)。
說穿了,字節(jié)做即夢,重點是鋪量,內(nèi)核其實還是互聯(lián)網(wǎng)產(chǎn)品,并非 " 生產(chǎn)力邏輯 ",而是 " 游戲運營邏輯 "。
策略上即夢 " 先免費 ",讓 99% 的輕度用戶免費爽,然后反饋數(shù)據(jù)優(yōu)化版本,用 1% 的重度用戶買單。
是不是跟某些游戲策劃的腦回路很像?
這個策略最大的一個好處是,一方面版本可以繼續(xù)升級,又有足夠的用戶交互反饋數(shù)據(jù)樣本來優(yōu)化模型,另一方面也能留一點商業(yè)化的火種。
但 " 游戲運營 ",本質(zhì)是個 UGC 的路子。這個策略能不能走下去,關(guān)鍵就在于用戶活躍度能不能維持下去。
維持用戶活躍度,其實還是得靠產(chǎn)品,產(chǎn)品好用自然就不缺用戶。所以怎么提升技術(shù),產(chǎn)品能力,是即夢眼下最需要解決的問題。
生產(chǎn)力邏輯也好,游戲運營邏輯也罷,兩家路線各有優(yōu)劣,就看誰先能跑出來了。
生成式 AI 對于短視頻的意義,如同自動駕駛對于網(wǎng)約車平臺的意義。這個業(yè)務(wù)做好了,與快手、抖音主業(yè)是有強大的協(xié)同效應(yīng)的。
這種協(xié)同效應(yīng),可能會進一步改寫流量商業(yè)的底層規(guī)則。
視頻大模型,能不能革流量成本的命?
除了短視頻平臺本身,視頻大模型,還能顛覆很多。
從落地的角度來看,未來視頻大模型的確有兩個重要的方向。
一個是專業(yè)化方向。
視頻大模型,最直接的一個價值就是降低影視的生產(chǎn)成本。
Sora 當初之所以備受關(guān)注,是因為人們顛覆了人們對于視覺生產(chǎn)力的認知,覺得它能夠顛覆很多行業(yè)的生產(chǎn)方式。
比如,Sora 會改變整個好萊塢的成本結(jié)構(gòu)。
一項新的技術(shù)、產(chǎn)品,先打透專業(yè)領(lǐng)域是一種普遍的規(guī)律。歷史上,很多偉大的互聯(lián)網(wǎng)產(chǎn)品,都是從 B 端到 C 端,比如最早的聊天軟件 MSN 就是應(yīng)用在商務(wù)端,到后來的 QQ、微信普及,才擴散到 C 端。
當文生視頻大模型強到一定程度,就變成了魔法,就像魔幻小說里寫的,人人都有了 " 言出法隨 " 的能力。
一句話變成了一個鏡頭、一段視頻,這會革了攝影師的命。
比特幣有個口號:"code is law"。代碼即法律。換到視頻生成大模型上就是:"word is movie"。
所述即所見。
放在影視行業(yè)里,所述即所見是很有價值的。
愛奇藝的自制劇有聲有色,但問題就是自制劇相當耗費資源,所以成本一直是個問題。
你看愛奇藝年報,2024 年愛奇藝總成本為 219.5 億,內(nèi)容成本就有 157.1 億。同年凈利潤同比暴跌 60%。天眼查 APP 融資信息顯示,愛奇藝 2018 年上市,直到 2023 年度凈利潤才轉(zhuǎn)正。
《哪吒 2》,比如《流浪地球》系列,成本都不低。原因就在于整個電影工業(yè)化成本的問題。我們的電影行業(yè)缺乏工業(yè)基礎(chǔ),好內(nèi)容的制作成本還是太高了。能解決這個問題的,目前看來只有 AI。
在內(nèi)容行業(yè),降本這件事兒,是能解放創(chuàng)造力的。
人類歷史中,鐵器的大規(guī)模使用降低了農(nóng)業(yè)生產(chǎn)成本,人活著的成本降低了,才有了諸子百家、才會有文藝復興。
這幾年,影視行業(yè)很慘,大的影視公司都在降本,從降本來看,視頻大模型是個不錯的方案。成本降下去了,好內(nèi)容多了,影視消費也才能起得來。大家周末更愿意進電影院了,也能帶動其他服務(wù)消費。
至此,服務(wù)消費的正循環(huán)就有了。
專業(yè)化方向之外,視頻大模型的另一個方向是大眾化。
百度有一個產(chǎn)品叫 " 秒噠 ",這個產(chǎn)品可以通過自然語言描述需求快速生成應(yīng)用程序,門檻很低。這個產(chǎn)品對于編程來說是劃時代的,有了這個產(chǎn)品,普通也能變成了程序員。
對于今天的內(nèi)容行業(yè)而言,文生視頻大模型也是劃時代的。這意味未來的內(nèi)容創(chuàng)作者數(shù)量可能再次井噴,流量基礎(chǔ)設(shè)施發(fā)生改變。
做內(nèi)容行業(yè)這么多年,我有這么一個感覺:內(nèi)容這個東西,本質(zhì)上是一種注意力貨幣,是會發(fā)生通縮的。也因此內(nèi)容越繁榮,供給越多,實際的單流量成本越低。
從圖文、到視頻,各種各樣的內(nèi)容暴增,單位流量成本是在一直降低的。
比如說,公眾號時代,圖文單位流量比搜索流量便宜。于是,微商崛起。短視頻時代,視頻平臺單位流量比圖文要便宜。然后直播帶貨崛起。
大模型時代,內(nèi)容供給成本降低,創(chuàng)作數(shù)量一定會再次暴增,到那時候,生成視頻的單位流量會不會更便宜?在此基礎(chǔ)上會不會有新商業(yè)形態(tài)?
我認為這些都是可以期待的。
視頻大模型的價值,一方面在于改變成本,另一方面也在于改變?nèi)藗儎?chuàng)造信息世界的方式。
人們創(chuàng)造信息世界,主要靠三種方式:" 碼字,代碼,拍攝 "。
前兩種已經(jīng)被大模型顛覆,現(xiàn)在正經(jīng)歷的是第三種。
現(xiàn)在的互聯(lián)網(wǎng)上的大部分視覺內(nèi)容,要么拍照片,要么拍視頻上傳,太沒有效率了。不符合互聯(lián)網(wǎng)的基本邏輯:極致的效率。
AI 天生就是效率機器。
幻方量化為什么能孵化出 DeepSeek,因為金融本身追求極致效率,這與 AI 的基因是相契合的。
不能否認,內(nèi)容創(chuàng)作是需要創(chuàng)意的,創(chuàng)意這個東西,AI 還不能完全替代人類,但有了這個效率工具,我們一定能加速進入下一個視覺互聯(lián)網(wǎng)時代。
大模型生成視頻,只是推動互聯(lián)網(wǎng)向下個時代變革的第一步,走出了這一步,也許離真正的元宇宙互聯(lián)網(wǎng)就不遠了。
最后,行業(yè)格局未定,視頻大模型仍有變數(shù)。今天的可靈 AI、即夢、通義萬相,一如當年的微信、飛信、來往。
圖文 AI 領(lǐng)域,過去以為大家都以為最后的王者會是文心一言、會是 ChatGPT,誰承想最后跑出來了 DeepSeek。
DeepSeek 顛覆了很多人的認知,證明大模型賽道,小而精的路線跑得通。那么問題來了,未來視頻大模型,會不會出現(xiàn)像 DeepSeek 一樣的 Gamechanger?
最終,一切都要交給時間去驗證。