當(dāng)前位置：前瞻產(chǎn)業(yè)研究院 ? 經(jīng)濟(jì)學(xué)人 ? 觀察家專(zhuān)欄

谷歌又沒(méi)能“遙遙領(lǐng)先”

分享到：

字母榜 ? 2023-12-11 09:34:01 　來(lái)源：字母榜　E6077G0

作者|畢安娣來(lái)源|字母榜(ID：wujicaijing)

千呼萬(wàn)喚始出來(lái)，谷歌終于釋放了大模型的新大招——Gemini。

當(dāng)?shù)貢r(shí)間12月6日，谷歌正式發(fā)布了Gemini大模型。在一份聲明中，谷歌CEO桑達(dá)爾·皮查伊（Sundar Pichai）稱(chēng)，這是谷歌迄今為止“功能最強(qiáng)大、最通用”的模型。

對(duì)于Gemini，谷歌就差說(shuō)出“遙遙領(lǐng)先”四個(gè)大字。皮查伊描述其意義是人工智能發(fā)展的一個(gè)重要里程碑，也是谷歌新時(shí)代的開(kāi)始：“這個(gè)新時(shí)代的模型代表了我們作為公司所進(jìn)行的最大的科學(xué)和工程努力之一。我對(duì)即將到來(lái)的發(fā)展和Gemini為全球人民帶來(lái)的機(jī)遇感到無(wú)比激動(dòng)。”

演示視頻中Gemini的表現(xiàn)的確稱(chēng)得上“驚艷”。在一段視頻中，谷歌的人員用視頻給Gemini 畫(huà)畫(huà)、展示物品，并和它對(duì)話。Gemini用語(yǔ)音和文字進(jìn)行回答，不僅可以識(shí)別出工作人員手繪的簡(jiǎn)筆畫(huà)是什么，還能“看”出其手持的玩具鴨子的材質(zhì)是“橡膠”，并且還和其玩起了互動(dòng)小游戲。甚至在工作人員詢(xún)問(wèn)鴨子一詞的普通話發(fā)音時(shí)，Gemini也精準(zhǔn)讀出，還順帶科普了普通話的四個(gè)音調(diào)。

這則演示之所以驚艷，是因?yàn)樗诤险故玖薌emini不俗的多模態(tài)能力。在圖像、視頻、音頻等的輸入和輸出中，Gemini不需要特別做切換，更貼近人與人交互的體驗(yàn)。皮查伊在一篇博文中提到：“Gemini一開(kāi)始就是為多模態(tài)打造的，這意味著它可以生成并理解、操作和組合成不同類(lèi)型的信息，包括文本、代碼、音頻、圖像和視頻。”

谷歌也拿出數(shù)據(jù)展示Gemini的能力，比如在MMLU多任務(wù)語(yǔ)言理解數(shù)據(jù)集測(cè)試中，Gemini Ultra不僅超越了GPT-4，也比人類(lèi)專(zhuān)家強(qiáng)。

眼尖的朋友不會(huì)忽略后綴“Ultra”。這次Gemini發(fā)布提供了三個(gè)版本，分別是輕便的Gemini Nano，可以在安卓設(shè)備上原生離線運(yùn)行；Gemini Pro，已經(jīng)接入Bard；Gemini Ultra，本次發(fā)布的最強(qiáng)版本。

實(shí)際上，這次發(fā)布Gemini最亮眼的表現(xiàn)由Gemini Ultra貢獻(xiàn)，也是這個(gè)版本對(duì)標(biāo)了GPT-4，但這個(gè)版本計(jì)劃2024年才會(huì)正式推出。而Gemini Pro已經(jīng)接入Bard，但目前只可在英文交互中被調(diào)動(dòng)，該模型對(duì)標(biāo)GPT-3.5，后者是OpenAI在2022年初就釋放的模型。至于Gemini Nano，“谷歌親兒子”Pixel手機(jī)的最新版Pixel 8 Pro的用戶(hù)將很快體驗(yàn)到。

總而言之就是，Gemini挺好的，就是“但是”有點(diǎn)多，承諾也多于當(dāng)下的應(yīng)用。更要命的是，在Gemini發(fā)布不久，就被外界扒出展示視頻疑似拼接剪輯的產(chǎn)物、Gemini Ultra和GPT-4的測(cè)試疑似被谷歌“雙標(biāo)”等問(wèn)題。

Gemini也許真的強(qiáng)，但是否達(dá)到了谷歌需要的“遙遙領(lǐng)先”？

一

先來(lái)看看Gemini在發(fā)布之后遭遇了什么質(zhì)疑。

首先是那個(gè)頗為驚艷的展示視頻，視頻中Gemini流暢地與工作人員對(duì)話，用多模態(tài)的方式進(jìn)行著交互。

但很快，展示視頻的聲明就被關(guān)注到了。聲明是這樣說(shuō)的：“為了演示的目的，（視頻中）延遲已經(jīng)減少，Gemini的輸出已經(jīng)進(jìn)行精簡(jiǎn)。”而這個(gè)聲明并沒(méi)有放在顯眼的位置，而是在谷歌發(fā)布的YouTube視頻的描述文本中，不仔細(xì)看很容易忽略。

難道谷歌的展示視頻并不是實(shí)時(shí)錄制，而是經(jīng)過(guò)編輯的？可能更糟。彭博社（Bloomberg）的專(zhuān)欄作家?jiàn)W爾森（Parmy Olson）就此事問(wèn)詢(xún)谷歌，得到了一位發(fā)言人的回應(yīng)：這段視頻是通過(guò)“使用視頻中的靜態(tài)圖像，并通過(guò)文字提示”制作的。

也就是說(shuō)，演示視頻雖然給人一種人類(lèi)和Gemini“視頻通話”暢聊的感覺(jué)，但這只是感覺(jué)，實(shí)際上視頻中工作人員所說(shuō)的話，是在念給Gemini的文字提示，而展示的也不是視頻，而是靜態(tài)圖像。

另有谷歌員工匿名向彭博社吐槽，對(duì)演示視頻并不感到驚訝，因?yàn)樗麄円呀?jīng)習(xí)慣了某種程度的營(yíng)銷(xiāo)炒作：“我認(rèn)為，大多數(shù)使用過(guò)LLM（大語(yǔ)言模型）技術(shù)的員工都知道，要對(duì)這一切持保留態(tài)度。”

面對(duì)外界的質(zhì)疑，谷歌選擇放低姿態(tài)，不僅放出了演示視頻背后詳細(xì)的交互過(guò)程，谷歌DeepMind的產(chǎn)品副總裁伊萊·柯林斯（Eli Collins）還明確表示，畫(huà)鴨子的演示展示的是一種研究層面的努力，至少目前不在谷歌的產(chǎn)品中。

其次是Gemini Ultra在測(cè)試中的表現(xiàn)。依據(jù)谷歌的展示，Gemini Ultra在大規(guī)模多任務(wù)語(yǔ)言理解測(cè)試MMLU中，得分高達(dá)90%，是首個(gè)在該測(cè)試中超越人類(lèi)專(zhuān)家的模型。MMLU綜合運(yùn)用了數(shù)學(xué)、歷史、法律、物理、醫(yī)學(xué)和倫理等57個(gè)科目，是測(cè)試AI世界知識(shí)和問(wèn)題解決能力的重要工具。

其中，谷歌展示的一張圖令人印象深刻，圖中Gemini的得分“遙遙領(lǐng)先”于GPT-4和人類(lèi)專(zhuān)家，圖中GPT-4的得分在最底部，人類(lèi)專(zhuān)家的得分大約在中間的位置，而Gemini Ultra的得分在頂部。

但人們很快就發(fā)現(xiàn)不對(duì)，GPT-4在MMLU中的得分為86.4%，人類(lèi)專(zhuān)家是89.8%，而Gemini Ultra的得分為90%，何至于在折線圖中展示出均分畫(huà)面的效果？

這不是縱軸尺度不均的把戲嗎？這個(gè)把戲騙不了打工人，畢竟大家在工作匯報(bào)的時(shí)候都熟練運(yùn)用了。

當(dāng)紅的AI初創(chuàng)公司HuggingFace的CEO菲利普·施密德（Philipp Schmid）在社交平臺(tái)上吐槽“永遠(yuǎn)別相信營(yíng)銷(xiāo)”，并貼出了他幫谷歌修正后的折線圖，Gemini Ultra的領(lǐng)先優(yōu)勢(shì)立刻變得不那么明顯了。

此外，施密德還發(fā)現(xiàn)了一個(gè)關(guān)鍵點(diǎn)，雖然同樣是對(duì)MMLU的測(cè)試，但GPT-4和Gemini的“待遇”不大相同。Gemini Ultra的得分是基于CoT思維鏈提示技巧，嘗試32次后取的最佳得分，但GPT-4是在無(wú)提示詞技巧下，嘗試了5次拿到的得分。

施密德也提到，其實(shí)同樣是用CoT@32（思維鏈提示技巧下嘗試32次），GPT-4的得分為87.29%，的確不如Gemini Ultral；但要是同樣在無(wú)提示詞技巧下嘗試5次，Gemini Ultra的得分其實(shí)只有83.7%，低于GPT-4的86.4%。

相當(dāng)于Gemini Ultra和GPT-4分別參加了兩場(chǎng)考試，都拿到了兩個(gè)分?jǐn)?shù)。明明是各自贏了一場(chǎng)考試，谷歌宣傳自己贏的那場(chǎng)考試就算了，還偏偏用自己在一場(chǎng)考試中的高分，去對(duì)陣GPT-4在另一場(chǎng)考試中的低分，怎么看都有點(diǎn)“不講武德”了。

二

自從ChatGPT出現(xiàn)，谷歌踏入尷尬之境。

一方面，谷歌在AI領(lǐng)域的野心與成就有目共睹。早在2011年，谷歌大腦Google Brain就已經(jīng)成立，目標(biāo)是研究深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)。次年，谷歌大腦由1.6萬(wàn)臺(tái)電腦集群組成的人工神經(jīng)網(wǎng)絡(luò)，在學(xué)習(xí)了10萬(wàn)個(gè)YouTube視頻后，沒(méi)有學(xué)習(xí)“貓”為何物而自行精準(zhǔn)識(shí)別出“貓”，震驚四座。

2014年，谷歌又以6億美元價(jià)格收購(gòu)DeepMind，當(dāng)時(shí)后者還是僅有50名員工的小公司。谷歌對(duì)AI如此舍得下血本，也直接促成了馬斯克等人應(yīng)激式地成立OpenAI，以對(duì)抗谷歌未來(lái)在AI領(lǐng)域可能形成的壟斷局面。

僅僅兩年后，已經(jīng)被谷歌收入麾下的DeepMind就推出了AlphaGo，擊敗圍棋頂尖選手李世石，一炮而紅。谷歌就此成為AI領(lǐng)域不可忽視的、第一梯隊(duì)的力量。

其后數(shù)年，做研究、發(fā)論文、推產(chǎn)品，谷歌沒(méi)有停下在AI領(lǐng)域的腳步。OpenAI的GPT模型之“T”，正是Transformer模型之意。Transformer模型是一種用于自然語(yǔ)言處理中的神經(jīng)網(wǎng)絡(luò)模型，是由谷歌的研究人員在2017年提出的，那一年皮查伊喊出“從移動(dòng)優(yōu)先轉(zhuǎn)向AI優(yōu)先”的口號(hào)。當(dāng)年寫(xiě)就Transformer論文的研究人員，也被冠以“Transformer八子”的稱(chēng)號(hào)，可見(jiàn)其分量之重。

但另一方面，ChatGPT推出之后，谷歌就陷入了被動(dòng)。

如果說(shuō)幾年前做“誰(shuí)會(huì)造出一個(gè)轟動(dòng)世界的大模型驅(qū)動(dòng)的聊天機(jī)器人”，那谷歌八成是猜測(cè)的大熱門(mén)。但這并不是故事的走向，OpenAI推出了ChatGPT，而谷歌至今沒(méi)有能與之抗衡的產(chǎn)品。

今年2月，在外界的矚目下，谷歌推出了聊天機(jī)器人Bard。作為ChatGPT的直接競(jìng)品，Bard被寄予厚望，卻不如預(yù)期。先是演示中出現(xiàn)事實(shí)錯(cuò)誤，讓谷歌母公司一夜之間市值蒸發(fā)千億美元。而后也沒(méi)能以性能表現(xiàn)吸引足量用戶(hù)，據(jù)Similarweb的數(shù)據(jù)，Bard全球月訪問(wèn)量只有2.2億次，僅為ChatGPT的八分之一。

谷歌在AI領(lǐng)域明明素有“遙遙領(lǐng)先”之態(tài)，為什么這次不能“遙遙領(lǐng)先”了，問(wèn)題到底出在哪兒？

“Transformer八子”也許能掀開(kāi)谷歌難題的一角。這八子目前已經(jīng)全部從谷歌出走，其中1位加入OpenAI，其余7人創(chuàng)業(yè)。彭博社引用谷歌科學(xué)家和工程師稱(chēng)，谷歌規(guī)模龐大，任何創(chuàng)意都要經(jīng)過(guò)多層確認(rèn)。就算創(chuàng)意通過(guò)，從創(chuàng)意到產(chǎn)品的門(mén)檻也很高。在谷歌，高級(jí)研究人才想將想法變?yōu)楝F(xiàn)實(shí)，難度頗大。

換句話說(shuō)，谷歌多少有點(diǎn)“大公司病”，這也可以解釋為何谷歌在應(yīng)對(duì)OpenAI和微軟的挑戰(zhàn)時(shí)顯得有些“遲緩”。

ChatGPT的推出，使得AI的戰(zhàn)場(chǎng)更加瞬息萬(wàn)變，看看OpenAI和微軟過(guò)去一年對(duì)模型和產(chǎn)品的迭代速度就知道了——今年2月微軟推出新必應(yīng)，3月OpenAI就正式推出了GPT-4，9月微軟推出微軟“智能副駕”Microsoft Copilot，10月就開(kāi)始向Windows 11用戶(hù)推送更新，11月OpenAI又推出了GPT-4 Turbo。況且OpenAI每次的發(fā)布會(huì)還會(huì)有真槍實(shí)彈的演示，動(dòng)輒就是“即日起可用”。在這樣的競(jìng)爭(zhēng)環(huán)境下，谷歌的“謹(jǐn)慎”就變成了一種詛咒。

三

谷歌有足夠的理由著急。

在AI驅(qū)動(dòng)的云計(jì)算競(jìng)賽中，谷歌一直落后于微軟。今年兩大巨頭多次同日發(fā)布財(cái)報(bào)，讓對(duì)比更加明顯。截至9月底的2023年第三季度財(cái)報(bào)顯示，谷歌云營(yíng)收低于華爾街預(yù)期，且為11個(gè)季度以來(lái)增長(zhǎng)最慢的一季。而微軟同樣截至9月底的2024財(cái)年第一財(cái)季業(yè)績(jī)報(bào)告則顯示，微軟智能云部門(mén)收入同比增長(zhǎng)19%，其中Azure更是同比增長(zhǎng)29%。

在Bard效果不佳的情況下，Gemini是谷歌尋求突破的一枚關(guān)鍵棋子，這也是Gemini還沒(méi)推出就備受矚目的原因。

今年4月，谷歌將谷歌大腦Google Brain和DeepMind合并，成為新的部門(mén)谷歌DeepMind。此前谷歌原生孵化的谷歌大腦與收購(gòu)而來(lái)且一直享有高度自主權(quán)的DeepMind之間，一直有資源搶奪和內(nèi)部競(jìng)爭(zhēng)的問(wèn)題，這與“Transformer八子”出走暴露出的谷歌的問(wèn)題一致。

而合并二者，顯示出了谷歌從組織層面上入手，掃清AI競(jìng)賽上的障礙之決心。合并之后，DeepMind聯(lián)合創(chuàng)始人德米斯·哈薩比斯（Demis Hassabis）成為谷歌DeepMind的CEO。

不出兩個(gè)月，哈薩比斯就在采訪中透露了Gemini項(xiàng)目，并放出豪言，稱(chēng)Gemini的能力將強(qiáng)過(guò)OpenAI的GPT-4。

在今年年中的谷歌I/O開(kāi)發(fā)者大會(huì)上，谷歌共提及143次AI，皮查伊首次承認(rèn)Gemini的存在。從那時(shí)起，全世界都在等著谷歌“憋大招”。

如此看來(lái)，就能理解谷歌為什么在那么多“但是”的情況下，就發(fā)布Gemini，又為什么要如此用力地營(yíng)造“遙遙領(lǐng)先”的形象。

好消息是，盡管外界質(zhì)疑頗多，但市場(chǎng)對(duì)谷歌Gemini的發(fā)布給出了正反饋。當(dāng)?shù)貢r(shí)間周四，谷歌母公司Alphabet的股價(jià)大幅上漲了5.3%，市值上漲800億美元。巧合的是，今年9月傳出的OpenAI最新估值正在800億美元到900億美元之間。谷歌一夜?jié)q出了一個(gè)OpenAI。

壞消息是，承諾大過(guò)落地的Gemini，需要實(shí)實(shí)在在地兌現(xiàn)承諾，2024年Gemini Ultra的正式推出將是一個(gè)關(guān)鍵節(jié)點(diǎn)。

而在那之前，只能默默祈禱OpenAI的GPT-5來(lái)得慢一些。就在上個(gè)月，OpenAI的CEO山姆·阿爾特曼（Sam Atlman）透露，GPT-5正在開(kāi)發(fā)中。

參考資料：

1、新浪科技：《兩個(gè)小時(shí)：谷歌說(shuō)了143次AI，股價(jià)連漲兩天》

2、財(cái)聯(lián)社：《OpenAI承認(rèn)正開(kāi)發(fā)GPT-5 終極目標(biāo)是相當(dāng)于人腦的超級(jí)AI》

3、極客公園：《谷歌 25 周年｜3.0——從 AI 弄潮兒到追趕者》

4、北京商報(bào)：《同日發(fā)財(cái)報(bào)：微軟贏了谷歌》

編者按：本文轉(zhuǎn)載自微信公眾號(hào)：字母榜(ID：wujicaijing)，作者：畢安娣編者按：本文轉(zhuǎn)載自微信公眾號(hào)：字母榜(ID：wujicaijing)，作者：畢安娣

本文來(lái)源字母榜，內(nèi)容僅代表作者本人觀點(diǎn)，不代表前瞻網(wǎng)的立場(chǎng)。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。（若存在內(nèi)容、版權(quán)或其它問(wèn)題，請(qǐng)聯(lián)系：service@qianzhan.com）　品牌合作與廣告投放請(qǐng)聯(lián)系：0755-33015062 或 hezuo@qianzhan.com

p28 q0 我要投稿

標(biāo)簽：谷歌人工智能

品牌、內(nèi)容合作請(qǐng)點(diǎn)這里：尋求合作 ››

產(chǎn)業(yè)規(guī)劃
園區(qū)規(guī)劃
產(chǎn)業(yè)招商
可行性研究
低空經(jīng)濟(jì)
高端裝備
生物醫(yī)藥

前瞻經(jīng)濟(jì)學(xué)人

專(zhuān)注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國(guó)產(chǎn)業(yè)咨詢(xún)領(lǐng)導(dǎo)者，專(zhuān)業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報(bào)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報(bào)告等領(lǐng)域解決方案，掃一掃關(guān)注。