李彥宏給AI開發者搭了一把梯子
作者|解碼工作室 來源|解碼Decode(ID:kankeji001)
1725年,法國的紡織工人Basile Bouchon發明了一種織布機,可以根據送入的穿孔卡片指令編織圖案。打孔的是“1”,沒有打孔是“0”。這幾乎是最早出現的二進制代碼,雖然此后執行的機器發生了很大變化,但代碼的基本構建塊卻就此延續了下來。
三百年后,編程已成為改變世界的無形力量。今天我們手中的智能手機、辦公室的自動化系統甚至工廠的智能制造,它無處不在。
但AI浪潮的席卷速度,不僅超過了以往任何一場技術革命,也讓編程有了另外一種可能——按照李彥宏的說法,大模型和生成式AI將徹底改變開發者這個群體。
而在這背后,是百模大戰后徐徐鋪開的AI原生應用建設,以及在這關鍵的賽道上,中國企業已經率先站上了起跑線。
1
AI原生應用開發,沒那么復雜
到目前為止,全世界已經發展出超過600門的編程語言。從語法簡單只有32個keywords的C語言,到以但丁《地獄》中第八層地獄命名的Malbolge(第一個程序花了兩年時間才被寫出來)。
但無論是哪種編程語言,開發者想要創建程序就要敲下海量的代碼。隨著代碼量越來越大,程序開發工作也變得無比繁雜。
例如Windows 95只有1500萬行,Windows XP為3500萬行,而目前程序員寫出來的最大軟件是Google在線服務,大概是20億行代碼,大概是一名程序員正常發量的13000倍。
而當前正值移動互聯網轉向AI時代,按照李彥宏的觀點,AI時代需要100萬量級的原生應用,趨近2021年手機App總量的三分之一。
如果參考支付寶僅2019年一年就增加了4億行代碼(相當于80個魔獸世界)的話,AI原生應用需要程序員敲下的代碼量可想而知。
而且AI原生應用在邏輯上完全不同于Native App,需要以AI為出發點,將AI作為核心驅動力,重新設計和構建應用。
不久前,一位開發者在論壇上發布了一則AI原生應用速通指南,雖然開發流程只有5條,但對于開發者來說工作量并不低,僅數據準備一項就要耗費大量的人力物力,更別提需要用到的關鍵技術。
但隨著Transformer推開大模型時代的大門,不僅AI應用的轉機來了,程序員開發者的轉機也出現了。
在AI時代,科技巨頭們不僅在意如何讓技術更容易地被用戶接受,同時也在思考如何簡化程序員的工作。
去年OpenAI推出的GPTs和今年Hugging Face發布的HuggingChat助手,它們通過將能力封裝,把開發門檻拉低,進而創造了一個新的職業——不會編程的開發者、任何一個普通用戶都能創建自己的AI應用。
如今,給普通人搭梯子的名單上又多了一家科技巨頭,并且是使用中文作為自然語言prompt。
2
“人人都是開發者”
「打開開發界面,第一步給應用起名,第二步填寫角色指令,第三步再插入需要的工具組件?!?/p>
這是出現在今年Create2024百度AI開發者大會上的一幕。在零代碼的情況下,一個AI原生應用就生成了。
開發者借助百度發布的AI原生應用開發工具AppBuilder,不寫一行代碼,最快只需三步,就可以用自然語言開發出一個應用,并且還能便捷地發布、集成到各種各樣的業務環境中。
在AppBuilder上面,百度也提供了一定的跨模態能力,開發者只需要給一段文字,或者幾句話,就可以快速創建繪畫類應用。百度文庫最新推出的漫畫生成和繪本生成功能,就利用了AppBuilder上提供的這類組件。
關鍵,類似這樣的開發工具,百度一口氣發布了三款,除了AppBuilder,還有智能體開發工具AgentBuilder和面向專業開發者的ModelBuilder,主打一個「開箱即用」。
其中,AgentBuilder也是零代碼開發,整個過程完全不需要編程,通過類似prompt(提示詞)的信息輸入,和簡單的幾步操作調優,就能迅速生成一個智能體。目前百度已經與攜程合作,提供酒店、景點、票務等旅游服務工具。
而為專業開發者準備的ModelBuilder,可以根據開發者的需求定制任意尺寸的模型,并根據細分場景對模型進一步精調,達到更好的效果。
ModelBuilder中既包括適合通用復雜場景的旗艦版ERNIE3.5和ERNIE4.0,也有Speed、Lite、Tiny三個輕量級大模型和ERNIE Character、ERNIE Functions兩個垂直場景模型,也覆蓋了國內外其它第三方主流模型,預置量多達77個大模型,是國內擁有大模型數量最多的開發平臺。
前兩款工具可實現“人人都是開發者”,相當于是AI原生應用的沖量擔當,而后一款工具則是保質擔當。
李彥宏判斷,未來絕大多數的AI原生應用都是MoE的,也就是大小模型混用,不依賴一個模型來解決所有問題。
而ModelBuilder也是參考MoE思路,開發者在一個平臺上可調用多個大模型,意味著開發成本和產品性能都能達到相對最優。
大會上展示的小度添添AI機器人日程規劃功能,就是調用了不同的模型。
先是由小模型ERNIE Tiny執行“模型路由”工作,把晨跑中的天氣問題分配給基于ERNIE Lite打造的精調模型,快速查出氣溫25度、天氣晴朗這些信息;同時,又把更復雜的日程安排,分配給性能最好的文心4.0大模型,來計算一天各項事項安排。
總的來說,MoE架構既能提升開發平臺的“寬度”,也能兼顧“深度”,大大降低開發時的算力消耗,降低應用門檻。
對多模態大模型而言,百度推出的三大AI開發神器,將會加速killer App的出現時間,而對于視覺大模型來說,其最大應用場景——自動駕駛,早已被市場驗真了。
百度在視覺大模型的發展有目共睹,不只是訓練AI如何生成視頻,更是訓練AI理解和生成一個真實的場景或世界。
基于超過1億公里的中國復雜城市道路測試里程數據,百度訓練出來的Apollo視覺感知大模型,具備檢測、跟蹤、理解、建圖四大基礎能力。百度也將這些能力下放到了具體產品,比如已在武漢實現7X24小時全天候運營的蘿卜快跑,以及將視覺感知大模型應用到了制圖領域的百度地圖。
3
梯子要穩固
去年,著名計算機科學家吳恩達曾在斯坦福做過一場題演講。他認為AI其實和電力、互聯網一樣,是一項通用技術,更多的機會在于大規模應用落地。
這與李彥宏此前的觀點不謀而合。在基礎模型之上,要有千千萬萬甚至數以百萬計的AI原生應用,大模型的價值才能被體現出來。
而今天百度發布的三大AI開發神器,相當于搭了一把梯子,讓開發者和企業能夠不費力的進入AGI時代。但這里面一個重要的前提是,這把梯子要足夠的穩固。
而所謂穩固,指的就是基礎大模型的技術水平要過硬。
從數據上看,相比一年前文心大模型的算法訓練效率提升了5.1倍,周均訓練有效率超過了98%,推理性能提升了105倍,推理的成本降到了原來的1%。也就是說,客戶原來一天調用1萬次,同樣成本現在可以調用100萬次。
發布一年零一個月以來,文心一言用戶數突破2億,API日均調用量也突破了2億,服務的客戶數達到了8.5萬,利用千帆平臺開發的AI原生應用數超過了19萬。
對于企業和開發者來說,基于文心大模型開發原生應用、做二次開發,都能夠擁有更低的推理成本和更高的訓練效率。
這主要基于李彥宏此前對大模型一個精準判斷,與模型開源會越來越落后不同,閉源有真正商業模式,能夠賺到錢,且在成本上有優勢,只要是同等能力,閉源模型的推理成本一定是更低的,響應速度一定是更快的。
事實上,有了強大的基礎大模型,百度能提供很多低門檻,甚至零門檻的開發工具,大大提高開發者的生產力。比如三大AI開發工具之外,基于文心大模型的智能代碼助手Comate。
不僅支持100多種語言和所有主流IDE平臺,可以推薦代碼、生成代碼注釋、進行代碼續寫、查找代碼缺陷、給出優化方案,還可以深度解讀代碼庫、關聯私域知識生成新的代碼。
上崗一年多以來,Comate已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業,生成的代碼采納率達到了46%,百度每天新增的代碼中,已經有27%是由Comate生成的。
顯然,想要壯大AI原生應用生態,僅靠某一家公司遠遠不夠,需要發動更多人一起參與創新。
去年5月,百度啟動了“文心杯”創業大賽,幫助創業者、開發者開發各種AI原生應用。在第一屆大賽中,百度為15支優勝團隊提供了數千萬元的資金支持,并在技術、團隊和資源上持續提供全方位扶持。今年將擴大項目篩選范圍、設置分賽場,加大對創業者的支持力度,特別優秀的項目將有機會獲得最高5000萬人民幣的現金和資源支持。
4
尾聲
2023年6月,Open AI安全系統負責人&前應用研究負責人Lilian Weng在博客中發表了一篇文章《大模型驅動的自主代理(LLM Powered Autonomous Agents)》。
Lilian Weng將AI發展路徑類比自動駕駛L1-L5,而人類當前所處的位置正好從Copilot向Agent過渡。
這對人類社會而言,意味著一次巨大的變革正在孕育,它將惠及產業和生活的方方面面。而在這個過渡階段里,如何讓更多“高樓大廈”在大模型的地基上拔地而起,正是中國在生成式AI的賽道上,實現反超的最大機會。
與此同時也是百度的巨大機會。文心一言、百度文庫、百度新搜索等,AI原生應用釋放出的新變現機會,將開啟長期增長空間。
中國有10億互聯網用戶,有強大的基礎大模型,有足夠多的AI應用場景,有全球最完備的產業體系,國家也在大力鼓勵和支持“人工智能+”行動,每一個人,每一個企業,只需要充分利用這些工具,就可以釋放無限的創造力和生產力。
免責聲明:本文基于已公開的資料信息或受訪人提供的信息撰寫,但解碼Decode及文章作者不保證該等信息資料的完整性、準確性。在任何情況下,本文中的信息或所表述的意見均不構成對任何人的投資建議。
編者按:本文轉載自微信公眾號:解碼Decode(ID:kankeji001),作者:解碼工作室
前瞻經濟學人
專注于中國各行業市場分析、未來發展趨勢等。掃一掃立即關注。