人工智能2024:模型端OpenAI走下神壇,應用端商業化漸清晰
作者|楊啟隆 來源|新識研究所
在經歷過2023年的狂飆后,人工智能相關產業仍然是2024年最火熱的行業之一。
將時間撥回到兩年之前,彼時,ChatGPT剛剛問世就引起了廣泛的關注。不過,雖然當時大家驚艷于LLM帶來的震撼,但也沒有想到在短短兩年之后,人工智能就已經以包括Chat在內的各種不同形式融入了我們的日常,并正以前所未有的速度、廣度和深度重塑生產生活方式。
而這些變化,則絕大多數發生在過去的一年當中。
那么,站在2025年的起點,就讓我們一起回顧一下過去一年中各大人工智能企業,在模型端、應用端取得了哪些進展?大廠之間的競爭格局發生了怎樣的變化,商業化又以怎樣的形式鋪開呢?
1
模型端OpenAI走下神壇,各家大模型“百花齊放”
據多家媒體表示,目前幾乎所有的人工智能龍頭企業,都在新模型開發上的付出與回報的差額正在逐漸擴大。原因則是由于算力與可使用數據的不足,被業界認為是大模型預訓練第一性原理的Scaling Law(認為模型的性能同計算量、模型參數量、數據大小成冪律關系),已經事實性受阻。
而在Scaling Law失效被大規模討論之前,其實OpenAI給大家的驚喜程度,已經放緩。
2024年中,OpenAI保持了一貫的領先者姿態,GPT快速迭代。
5月13日,OpenAI的CTO Mira Murati,在三十分鐘的時間中發布了4項功能,而其中最重要的就是GPT-4o。相比于GPT-4需要將音頻與文本進行相互轉換后才能處理,GPT-4o作為一個原生的多模態模型,所有輸入和輸出都由同一神經網絡處理,在發布的時候可以說是進行了一波“屠榜”。
9月13日,OpenAI官宣發布o1,包括兩種版本o1-preview和o1-mini。o1在響應用戶的請求之前,會像人類“深思熟慮”一樣,進行很長的內部思維鏈思考,并可以在這個過程中嘗試不同解決問題的方法甚至自我糾正錯誤。這也讓其在數學、物理、化學、編程等領域,擁有更強的能力。
12月20日,OpenAI在其連續12天的直播中,發布了最新的推理模型o3及其輕量版o3-mini。在編碼、數學和科學問答上相比于o1有了很大的提升,并成功完成了對ARC-AGI基準的突破,完成了人工智能在適應新任務的能力上重大飛躍。
不過,雖然從4o到o1再到o3都有著長足的進步,但或許是因已有基準較高,所以在實際的使用體感上,再也沒有ChatGPT問世時的驚喜。
此外,每一代最新模型在成本方面也實在算不上經濟。據ARC-AGI 發起者在測試報告中寫道,以o3為例,用戶能夠以每項任務大約5美元(折合人民幣約36元)的價格來支付人工解決ARC-AGI任務,而在低推理模式下,o3完成每個任務需要花費17-20美元(折合人民幣約124~145元)。
這樣的成本,無論對于個人用戶還是企業用戶來說,都實在是“不可承受之重”。
也就在OpenAI的新玩意沒有給出大家預料中的驚喜的時候,其他AI企業的大模型進度卻在飛速趕上。
3月,Anthropic推出了Claude 3系列,其中的不同版本根據場景不同進行了特定的優化;6月,Claude 3.5問世,各項能力均有不俗提升;10月,升級版的Claude 3.5 Sonnet和全新的Claude 3.5 Haiku同大家見面,在價格與生成速度不變的情況下,實現了全面性能提升。
Meta則于9月推出了Llama 3.2 AI模型,并于次月發布了這兩個模型的量化版本,使其真正能用得到的場景快速增加。
谷歌的Gemini也在母公司的支持下快速迭代,并應用于生產場景中——據谷歌首席執行官桑達爾·皮查伊在最新季度財報電話會議上發言,Gemini API 的使用量在過去六個月中飆升了14倍,展現出了強勢的發展勁頭。
在國內,以阿里、百度、字節、騰訊為首的大廠和新興的“六小虎”們,也同樣進行著快速迭代,譬如Kimi的o1,就很好地對標了GPT-o1,在深度思考方面取得了長足的進步。
隨之而來的,就是OpenAI市占率的降低。
據Menlo Ventures的調研數據,相比于2023年,在閉源模型中,OpenAI的先發優勢有所削弱,企業市場份額從50%降至34%。而其丟失掉的市場份額,則主要被Anthropic和谷歌拿下。
要具體到案例上,最具有標志性的事件,一定是Sora畫出的大餅。
2月,OpenAI發布了首個文生視頻模型Sora。據介紹,Sora可以直接輸出長達60秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。從當時放出的demo來看,無論是精細的畫質,還是長達一分鐘的輸出時間,都以一種降維打擊的形態,錘爆了當時甚至截至目前來說所有的文生視頻大模型產品。
也就在Sora發布demo到正式面世的大半年中,眾多對手奮起直追,只不過到了發布前的最后一刻還是沒有哪家的文圖生視頻能做到Sora放出的demo那般絲滑。
只不過,在Sora正式開放之后,大家卻發現Sora的demo真的只是demo,具體生成的內容同已有的文圖生視頻應用相差不大。一名OpenAI員工在直播中建議道,“如果你期望點擊一個按鈕就讓Sora生成一部故事片,我認為這種期望是錯誤的。”
價格方面,想要訂閱可以無限生成1080p視頻的pro模式居然高達200刀,這樣的定價對于那些只需要Sora的用戶來說,真的會讓人眼前一黑。
之后,谷歌迭代推出的Veo2,也被人認為是超越Sora的文圖生視頻產品;而國內的Vidu、可靈、即夢、海螺、清影視頻,也有著不輸Sora太多的表現。畢竟,既然都是抽卡,誰不愿意抽個價格更低效果還差不多的卡呢?
而這,也是大模型競爭中的冰山一角,或許在不久后的將來,OpenAI都只會以相對領先的“領軍人”角色存在,更多的AI大廠會在更多的AI賽道中,你追我趕。
2
應用端Chatbot、AI陪伴、圖片編輯霸榜,BC兩端商業化漸清晰
隨著各大人工智能企業在模型端的持續發力與成熟,作為大模型能力想要落地用戶的媒介,應用端也在2024年迎來了最好的發展時期。
據Sensor Tower發布的《2024年AI應用市場洞察》,1-8月全球AI應用下載量同比增長26%至22億次,內購收入激增51%至20億美元,預計全年下載量將突破33億次,收入達到33億美元。
具體應用方面,ChatGPT在收入榜、下載榜與活躍用戶榜均居首位,而在下載榜Top30中,幾乎都是Chatbot應用、圖片編輯應用與AI陪伴應用。
其中,Chatbot應用與圖片編輯應用主要是作為工具存在,而以Character.AI與Talkie AI為代表的陪伴式AI產品的用戶黏性更高,2024年Character.Al平均每日會話次數高達25次,平均每次會話接近4分鐘,用戶每日使用時長超過1.5小時,遠遠高于ChatGPT。
此外,在該榜單里,國內AI產品豆包位列下載榜第五,但據AI產品榜的最新數據,豆包11月的MAU已經來到了59.98M,僅次于ChatGPT。
除了這些面向大眾的、成熟的應用之外,醫療機器人、生物醫學影像、數字療法等全新技術已經應用于了尖端治療中;教育領域中個性化學習、智能教學助手、沉浸式學習體驗等技術也已經并不罕見;能源領域里,具體負責調配管理與優化、故障預測與維護的系統也已經投入日常使用......
可以說,2024年的人工智能,正在將觸手伸向幾乎所有的傳統或非傳統行業中,并且已經有越來越多細分領域中的專業應用從中涌現。
而隨著AI應用滲透率的提升,相關商業化也隨之起步。
在C端市場里,AI應用大多都采用了訂閱制的變現方式。其中,除了OpenAI推出的Plus會員收費高達200美元之外,Pro會員的收費價格同Anthropic的Claude Pro、Google的Gemini Advanced幾乎完全一致,分別為20、20、19.99美元。
而國內大模型產品的收費方式也幾乎一致。
譬如,目前國內Chatbot主流產品中唯一推出付費會員模式的文心一言,就推出了49.9元的連續訂閱包月價格,開通會員后可使用最新的文心大模型4.0與4.0 Turbo;而在文圖生視頻領域中,包括即夢、可靈在內的大多數AI創作應用,也同樣采用了月度、季度會員兌換積分,積分使用服務的鏈路。
B端市場中,由于有了云服務的“前車之鑒”,按Tokens/API接口調用次數收費是相對已經成熟、也是大多數大模型廠商都會選擇的收費方式。而在這些AI大廠之間,大模型的價格戰早已打響。
從今年5月開始,中國云廠商就開始了大模型推理算力價格戰。包括字節、阿里、百度在內的老牌云廠商,已經把大模型推理算力價格打了骨折,每token的價格幾乎每隔一段時間都要再創一次新低。
而在未來,B端的AI商業化,也大概會像云時代的競爭一般,隨著基礎模型的優化與算力芯片的迭代,逐漸變為AI時代的又一場“卷王”競爭,但如何在這場不得不打的價格戰中,通過提升企業客戶最關心的模型能力、效果殺出重圍,才是AI大廠們最需要關心的核心命題。
《OpenAI發布新模型GPT-4o:對所有人免費、更易用、更強》,知危;
《OpenAI最強推理模型o3發布,推理能力達新高》,虎嗅智庫服務;
《萬億市場 !AI : 從模型到算力、應用全面繁榮!2024年末總結》, AI云原生智能算力架構;
《ChatGPT發布兩周年,OpenAI市占率怎么還下降了?》,未來研創科技;
《2024年AI應用市場洞察》,Sensor Tower;
編者按:本文轉載自微信公眾號:新識研究所,作者:楊啟隆
前瞻經濟學人
專注于中國各行業市場分析、未來發展趨勢等。掃一掃立即關注。