估值數十億,批量生產數字人!中國獨角獸盯上直播電商
圖源:攝圖網
作者|天下網商 來源|天下網商(ID:txws_txws)
對話司馬華鵬:直播只是當下數字人能替你干的工種之一。
硅基智能創始人司馬華鵬最近“寫”了一本新書——《大模型時代:ChatGPT拉開硅基文明序幕》。
確切地說,這本圍繞人工智能、大模型、ChatGPT、數字人等領域展開討論,前后洋洋灑灑數十萬字的著作,是他與團隊一起勾勒出框架和脈絡,然后交給ChatGPT完成撰寫的。甚至,AI還攬下了部分的銷售工作。
與DNA編碼為核心的碳基生命相對應,以文本編碼為核心的AI智能體為社會注入了新的硅基勞動力資源。
從連續在科技領域投入和創業的角度來看,司馬華鵬的履歷較為“硬核”:2002年做跨國公司LANSEAL、為企業打造信息安全產品;2007 年在歐洲創立虛擬殺毒軟件公司,服務過數十萬客戶;2017年,他又成立了主攻AIGC領域的硅基智能。
彼時,硅基智能是中國最早一批專注于智能語音機器人以及商業場景推廣的企業之一。
公司創立初期,司馬華鵬希望迅速推進數字人開發,圍繞多個場景打造硅基勞動力。然而,ChatGPT尚未出世,AIGC的應用在當時并未達到可感可視,市場上有相應認知的客戶屈指可數,數字人業務的開端并不順利。創立初期,其地推業務團隊主要通過抖音等平臺聯系各類達人、KOL推薦數字人產品。
“前幾年打市場,我們被拒絕了幾萬次都有,甚至有時候提出免費給客戶做,也有很多人表示質疑。”司馬華鵬坦言。
不過,他依然相信AIGC與數字人人應用的前景:“硅基生命是開源開放的,他們集體進步,可以快速復制。擁有這些特性的硅基勞動力,可以把人從繁重的重復性腦力勞動中解放出來,讓人回歸人的價值。”
如今來看,這一場關于人工智能應用的牌局,司馬華鵬“賭”對了。中國以及全球的經濟思維與生產形勢的變化,都在逐步成為支持這一論斷的重要依據。
首先是以ChatGPT走紅為引子,AIGC概念走向普及,一批頭部企業的大模型逐漸加深了人們和市場對AIGC應用優化、取代部分人工工作的理解和接受度。
據中關村論壇人工智能大模型發展分論壇數據,截至今年5月末,中國已發布了79個大模型。從全球視角來看,美國谷歌、OpenAI等機構不斷引領大模型技術前沿,英國、俄羅斯、以色列、韓國等地也有越來越多研發團隊投入大模型研發。就全球已發布的大模型分布顯示,中國和美國處于大幅領先地位,數量超過全球總數的80%。
一個鮮明的例子是,進入2023年后,司馬華鵬再也不用跟客戶們一遍遍解釋公司名字“硅基智能”的由來。
其次是人口紅利正在變化,AIGC作為“新勞動力”的價值優勢將進一步發揮。統計數據顯示,2022年末,中國人口比上年減少85萬。中國社會科學院國家高端智庫首席專家蔡昉在新書中談到,“人口紅利消失的挑戰也是改革紅利應運而生的機遇。”
事實上,AIGC已經在多個領域開始扮演重要的“勞動力”角色。比如,華為的盤古大模型近期落地山東省內開采儲量最大、礦井服務年限最長的現代化大型跨井“李樓煤礦”,其功能之一是輔助防沖部門進行防沖卸壓工程規范性驗證,可以降低82%人工審核的工作量,實現防沖工程100%驗收率。
而司馬華鵬則踩準了電商直播與超寫實數字人契合的原點。在近期與謙尋控股合資的謙語智能發布會上,硅基智能表示當前已經為超過40萬的人克隆了硅基AIGC數字人分身。
“AIGC的發展,不是說完全淘汰和取代人工,而是訓練和催生出善于理解和使用AI的人,解放人力、服務人民,告別部分機械、重復性的腦力勞動。”早在硅基智能成立之初,司馬華鵬便已定下目標:2025年為全球提供一億硅基勞動力。
今年5月,硅基智能推出了炎帝大模型,不同于傳統的ChatGPT類通用大模型,炎帝大模型是一個多模態的行業腦,它將私有域知識用LLM大模型技術訓練而成,疊加AIGC數字人技術,為對應行業提供“勞動力”。基于炎帝大模型的能力,硅基智能AIGC數字人在直播、短視頻、電影生成等商業化場景中實現了可復制式的下沉,進一步擴大了AIGC與大眾日常消費的應用接觸面。
公開資料顯示,以上一輪C輪融資為節點,硅基智能已獲得騰訊投資、招銀國際、國新央企、紅杉資本等9輪融資,擁有80余項授權發明專利,公司估值近10億美元,稱得上是中國AIGC獨角獸。
而機遇中也隱藏著不小的競爭。隨著越來越多的科技公司試水大模型,AIGC整個賽道狼煙四起,其應用模式也更進一步地謀求走出行業壁壘、靠近社會大眾消費。此間,利潤和效率的考量成了AIGC后續發展中無可規避的硬性門檻。
前幾年元宇宙、虛擬人變現存疑的問題暴露后,AIGC如何找到可持續的商業模型、在不同的使用場景實現靠岸?關于行業大模型與通用大模型的具體應用,誰又能更加迎合當下市場的選擇?
近日,《天下網商》對話硅基智能創始人司馬華鵬,以下為對話實錄,經編輯整理。
為什么做數字人?
《天下網商》:是什么促使您從電話機器人轉到了AIGC數字人的行列?
司馬華鵬:首先硅基智能有明確的進步方向。我們做的產業叫硅基勞動力,勞動力本質上考驗的是背后的NLP(自然語言處理)核心交互能力。我們畫了一棵圣誕樹模型,圣誕樹上掛了好多職業,樹枝開叉的高低體現了它對NLP要求的水平,我們開發的炎帝大模型的自然語言處理水平在不斷上漲,那么它就會像水一樣去覆蓋這些職業的工作領域。
最初我們做電話機器人,屬于 NLP中交互深度不高的領域,如果硅基智能停留于此,就相當于我們把大模型的能力邊界做了一個界定。所以2017年發明電話機器人后,到了2019年我們的重心轉到了AIGC數字人,也放棄非常大一部分收入和利潤。
一方面,大模型如果走老路、再往下發展就容易遇瓶頸;另一方面,從賺錢角度來說它是一門生意,但在用戶體驗上,現在哪怕是銀行,接到的都可能是騷擾電話,所以在科技向善的角度,它不一定是一門好生意。
轉做數字人還有一個重要的契機。2018年1月,公司一位合伙人的母親去世,參加出殯的時候,我答應他把他的母親用AI“克隆”出來。當時去世老人只留下了微信語音消息、日常照片等資料,我們先做了聲音克隆,后來又做了形象克隆,再后來又加了對話互動。
這門技術現在也應用在數字人商業化的各個領域。這一路走過來,我們并不是純商業的,也是對一個朋友的承諾。
為什么AI可以“闖入直播間”?
《天下網商》:這樣聽起來,初衷是一對一的人機互動,但之前您提到過商業化的大模型還是中交互?
司馬華鵬:中交互是相對于強交互而言的。如果AIGC應用的橫軸是情感要素,縱軸是商業要素,那么目前對于我們而言,兩者交匯點就是在中交互。
舉個簡單的例子,今天我可以跟1000個客戶見面,但事實上如果要一一碰面,可能只能一天見3個。同理,AIGC去做一對一的輸出,算力只能針對于一個領域、一個客戶,就不能讓它的算力和算法集中。
如果是中交互,我生成一套話術、一個方法論,可以面向成千上萬人。只要轉化率能比一對一的效率高,那是它就是劃算的,是能賺回來的。所以,中交互就構成了AI的一個很好的商業模式。
《天下網商》:是交互模式影響了AIGC業務的主攻方向嗎?
司馬華鵬:從商業上算,我們認為中交互與商業的結合點就在直播上面。比如我們這場對話,只是閑聊、不對外發布,內容產生的價值會更低。但如果聊完之后,內容分布在各個賬號里面,傳播價值就會很大。直播也是一樣,數字人適合在其中找到一個商業和情感的黃金交叉點。目前,我們認為短視頻和直播等都是非常合適的。
《天下網商》:但直播行業很“卷”,大家都會關注到效率和成本,硅基是如何考慮這點?
司馬華鵬:從前些年元宇宙的爆發,到ChatGPT引發的高潮,基于數字人的技術,其實有不同研究方向的流派。之前大家認識到的許多虛擬人,其實是3D技術做的,它有一個非常大的問題,就是非常貴,有的幾十萬甚至上百萬才做一個。
我們在做的版塊,屬于AI生成數字人。依靠硅基智能的炎帝大模型,可以實現做一個數字人從頭到尾不需要人類的參與,因為它已經學習了人類巨量的視頻數據,包括怎么講話、怎么做動作、怎么展現微表情等。
隨著訓練數據越來越多,過去大模型克隆一個人大約需要30分鐘,后來降到10分鐘、5分鐘、1分鐘,甚至現在我們有一張照片就可以把你克隆出來,成本呈現巨大的下降趨勢。
所以,現在我們可以做到將克隆一個人的AI形象,降到幾千塊錢。你把你的聲音和形象的數據發給我們,基本立等可取。幾千塊錢,對于幾乎所有用戶都是能接受的。
《天下網商》:直播重視交互,這樣才能有情感感染、讓觀眾有消費欲望,怎么讓AI主播更像真人主播呢?
司馬華鵬:這就是第二個攻關。人工智能的基石叫圖靈測試,我們的AIGC數字人,都可以做到“以假亂真”。
硅基智能提出來圖靈測試的三個階段,第一階段是大家廣泛認知的,傻傻分不清,形態上相似。
第二階段叫雙向情感交互,也就是說它不僅能在整個視覺上通過圖靈測試,同時它還能通過語言、語氣、動作等習慣從價值交換上進一步達到圖靈測試。就是說即使今天你分辨不出是不是真人主播、真人企業家在直播,但你還是能夠在互動中跟他建立信任、不斷地買東西,實現雙向情感交互。
第三階段我們叫死生相契,我們也在用這個技術構建數字人與人類之間的一對一實時交互。這是基于用戶和AI之間關系的一種升級,比如今天我們養一個AI,我放到直播行業讓它播一個月,它可能真的就掙幾十萬回來了,它為你賺那么多錢,你持續支付AI成長的算力費用,雙方自然可以建立信任、成為好朋友,這就是第三個階段。
我們做更真實的數字人,就是圍繞這條路線在做。
虛擬主播產生價值需要組合拳
《天下網商》:您曾說,不是買了數字人就能做好直播。那么我們為什么還要推動數字人進入直播?
司馬華鵬:我們可以針對性地將電商領域知識加入大模型,訓練出一個直播行業腦。因為行業內95%以上的公司,實際做的是平播和店播,而且由于直播投入增大、專業性越來越細化,還有許多商家其實是做不了真人直播,或者承擔不了高額的成本。如果AI能做得比大部分主播更好,或者更便宜,那就對商家產生了價值。
《天下網商》:商家肯定希望產生更多價值,那如何讓數字人做好直播工作呢?
司馬華鵬:買一臺電腦,和能寫出一個好的程序,中間距離太遠了。數字人進入直播也是一樣,我們認為,有6個要素左右著商家的直播是否成功。
這6個要素分別是科技、運營、供應鏈、IP、金融、賬號。我們在其中更多是扮演了科技和工具的角色。
舉個例子,有一家公司買了數字人產品,用在一個新的平臺賬號上跑,跑了三天被封了或者流量沒跑起來,就認為數字人不行,但如果說公司拿旗下最優質的賬號測試,他很可能一下就跑出來。因為一方面抖音等平臺已經逐漸規范了數字人直播的規則,另一方面數據和轉化率本來跟賬號相關性很大。讓數字人從0到1去跑,結果鎩羽而歸,假如只歸咎于技術,其實是很傷害這個產業的。
《天下網商》:所以硅基智能的數字人會得到哪些支點?
司馬華鵬:直播成功背后,運營要素占的主導是非常大的,所以從一開始我們就在這個領域尋找盟友。我們認為只賣給客戶單一的工具,他很難成功,甚至說在這個過程中遇到非常多的困難,會超過我們這家科技公司的想象。
因此我們攜手了謙尋控股和部分業內頭部的公司。事實上,我們很早就希望找一些優質的運營公司,把客戶跑通直播的距離縮短。比如,經過專業MCN機構的培訓或課程,然后再加上數字人直播的工具,商家可能一個月或者一個禮拜就能熟練的跑直播了,運營能力在其中占了重要因素。
直播只是當下它能替你干的工種之一
《天下網商》:您對數字人還有哪些期待?
司馬華鵬:從擬人態到雙向情感交互,再到此生相契,其實這個路線圖已經畫得很清楚了。未來每個人都會有自己的一個數字伴侶,它可能就是你的Soul Mate、他能替你做的事情非常多,就像鋼鐵俠和賈維斯這種關系。
AI克隆這個事情現在只需要幾千元的成本,你在《流浪地球2》里看劉德華對話AI女兒,大家還覺得很科幻,但是今天我們已經做出來了。
雖然整個過程還很長,但就是這么一個路徑,直播只是當下它能替你干的工種之一。
編者按:本文轉載自微信公眾號:天下網商(ID:txws_txws),作者:天下網商
前瞻經濟學人
專注于中國各行業市場分析、未來發展趨勢等。掃一掃立即關注。