日产精品久久久_m麻豆传媒映画_激情久久久久_久久爆操_久久在草_亚洲a久久

報告服務熱線400-068-7188

押注向量數(shù)據(jù)庫,為時過早?

分享到:
20 科技云報到 ? 2023-10-07 19:23:23  來源:科技云報到 E6881G0

1

圖源:攝圖網(wǎng)

作者|科技云報道 來源|科技云報到(ID:ITCloud-BD)

在大模型的高調火熱之下,向量數(shù)據(jù)庫也獲得了前所未有的關注。

近兩個月內(nèi),向量數(shù)據(jù)庫迎來融資潮,Qdrant、Chroma、Weaviate先后獲得融資,Pinecone宣布1億美元B輪融資,估值達到7.5億美元。

東北證券預測,到2030年,全球向量數(shù)據(jù)庫市場規(guī)模有望達到500億美元,國內(nèi)向量數(shù)據(jù)庫市場規(guī)模有望超600億人民幣。

但是在這蒸蒸日上的發(fā)展態(tài)勢下,向量數(shù)據(jù)庫依然面臨著不可忽視的挑戰(zhàn)。

有聲音認為,不必專門開發(fā)一款純粹的向量數(shù)據(jù)庫,而是可以在現(xiàn)有數(shù)據(jù)庫的基礎上添加一些層,賦予其向量檢索的能力。更有業(yè)內(nèi)人士認為,現(xiàn)在入局向量數(shù)據(jù)庫可能并非合適的時機。

那么,向量數(shù)據(jù)庫是否算得上AI時代的標配?其熱度能維持到幾時,此時押注后續(xù)又要擠出多少泡沫?

 01

 向量數(shù)據(jù)庫

  大模型的“海馬體”

與傳統(tǒng)數(shù)據(jù)庫不同,向量數(shù)據(jù)庫不依賴于結構化格式,而是將數(shù)據(jù)作為數(shù)學向量存儲在高維空間中并對其進行索引。

這種方法被稱為“向量化”,可以更有效地搜索相似性并更好地處理復雜的數(shù)據(jù)類型(圖像、音視頻、自然語言)。

某種程度上,向量數(shù)據(jù)庫代表了數(shù)據(jù)存儲和檢索的范式轉變。隨著大模型的興起,向量數(shù)據(jù)庫的優(yōu)勢得以充分發(fā)揮,甚至有人將其視為AIGC成功的基石。

一種通俗的比方是,行業(yè)內(nèi)將大模型稱為“大腦”,向量數(shù)據(jù)庫則是其“海馬體”。

目前的大模型都是預訓練模型,對于訓練截止日之后發(fā)生的事情一無所知,第一是沒有實時的數(shù)據(jù),第二是缺乏私域數(shù)據(jù)或者企業(yè)數(shù)據(jù)。

向量數(shù)據(jù)庫可以通過存儲最新信息或者企業(yè)數(shù)據(jù)有效彌補了這些不足,讓大模型突破在時間和空間上的限制,加速大模型落地行業(yè)場景。

同時,通過向量數(shù)據(jù)的本地存儲,還能夠協(xié)助解決目前企業(yè)界最擔憂的大模型泄露隱私的問題。

不過值得一提的是,向量技術并不新鮮,早在ChatGPT橫空出世之前,向量數(shù)據(jù)庫非常小眾。前文提到的兩家初創(chuàng)公司Pinecone和Weaviate都成立于2019年,但此前無論是融資還是營收都是乏善可陳的狀態(tài)。

Pinecone聯(lián)合創(chuàng)始人兼首席執(zhí)行官Edo Liberty曾坦率地提到,如果沒有ChatGPT的出現(xiàn),我們根本不可能獲得巨額融資。

軟件服務初創(chuàng)公司Heltar的創(chuàng)始人Avyukt Aggarwal也談到,AIGC的爆火成就了向量數(shù)據(jù)庫。

“每次淘金熱都會有人賣鏟子。對于生成式AI,鏟子是什么?向量數(shù)據(jù)庫。幾乎每一個LLM支持的應用程序都在使用它們或即將使用它們。”

02

 向量數(shù)據(jù)庫

   有必要走向專業(yè)化嗎?

向量數(shù)據(jù)庫系統(tǒng)的誕生,來源于具體業(yè)務需求——想要高效處理海量的向量數(shù)據(jù),就需要更細分、更專業(yè)的數(shù)據(jù)基礎設施,為向量構建專門的數(shù)據(jù)庫處理系統(tǒng)。

但這種路徑是必須的嗎?

從產(chǎn)品層面講,如果傳統(tǒng)數(shù)據(jù)庫廠商不單獨研發(fā)向量數(shù)據(jù)庫,那么基本上會主張支持原生的向量詞嵌入和向量搜索引擎。

向量數(shù)據(jù)庫市場的陣營,在ChatGPT影響之前就已經(jīng)在形成分化,既包括提供開源組件的Milvus、Vald、Weaviate、Qdrant、Vaspa、Vearch、AquilaDB、Marqo,到商業(yè)化服務產(chǎn)品Pinecone,再到大廠谷歌推出的Vertex AI匹配引擎,數(shù)據(jù)庫廠商Elastic和Redis基于自身提供的向量檢索功能等等。

這其實也表明了當前向量數(shù)據(jù)庫市場存在的兩種路線:

一個是基于分析數(shù)據(jù)庫的向量化執(zhí)行引擎,英文是Vectorization,這是學術界2013年提出的名詞,如Clickhouse、Spark引擎,是一種新型的執(zhí)行方式,用于處理傳統(tǒng)的結構化數(shù)據(jù)如表單等,更多的是結構化數(shù)據(jù)分析數(shù)據(jù)里面做并行執(zhí)行的一種方式,在新型的處理芯片上進行處理。

另一個則是推出向量數(shù)據(jù)庫(Vector Database),本質上處理的是AI領域的一類新型數(shù)據(jù)類型,例如對多模數(shù)據(jù)的處理,相比其他的向量檢索技術在檢索速度和精準性上都有了一個很高的提升。

后者的做法也基本在幾家主流云廠商如亞馬遜云、阿里云上能夠看到,而這些云平臺應用市場也會提供給這些第三方向量數(shù)據(jù)庫企業(yè)進行托管。

例如,阿里云開發(fā)的內(nèi)存數(shù)據(jù)庫Tair,在兼容Redis生態(tài)的同時,也具備向量檢索能力,實現(xiàn)緩存+向量二合一,已經(jīng)投入在電商等場景。

有業(yè)內(nèi)人士認為,對于簡單的用戶和場景來說,在傳統(tǒng)數(shù)據(jù)庫上添加一個向量分層來滿足技術發(fā)展需求,這種方法是可行的。

然而,考慮到 AI 場景和產(chǎn)業(yè)需求,情況可能有所不同。AI領域的迭代非常快,隨著數(shù)據(jù)量和應用場景的增加,傳統(tǒng)數(shù)據(jù)庫可能不再適用于高要求的計算密集型場景,向量數(shù)據(jù)庫可能才是最終的解決方案。

03

 押注向量數(shù)據(jù)庫

  挑戰(zhàn)頗多

作為今年以來的熱門技術賽道,向量數(shù)據(jù)庫已吸引了大量廠商和創(chuàng)業(yè)團隊入場,先發(fā)者與后來者,老牌廠商與新生力量之間的競爭正在持續(xù)升溫。

但值得注意的是,向量數(shù)據(jù)庫真的值得廠商全力投入嗎?

在《為什么你不應該投資向量數(shù)據(jù)庫?》一文中,吳英駿表示,現(xiàn)在入局向量數(shù)據(jù)庫可能并非合適的時機。其理由主要集中于以下幾點:

其一,先發(fā)優(yōu)勢明顯。目前向量化技術目前已十分成熟,并存在大量開源解決方案,在不同的領域也存在不同的向量化方案,潛在用戶可以很容易地在現(xiàn)有市場中找到合適的選擇。

其二,需求層次不同。如果一家公司已經(jīng)采用了Elastic,Redis,SingleStore或Rockset等商業(yè)數(shù)據(jù)庫,并且不需要高度先進的向量搜索功能,則可以充分利用這些數(shù)據(jù)庫的現(xiàn)有功能。

盡管在向量數(shù)據(jù)處理方面的表現(xiàn)不如專業(yè)的向量數(shù)據(jù)庫,但依然可以滿足多數(shù)用戶的一般要求。

其三,技術在不斷前進。隨著數(shù)據(jù)庫領域技術的進步,越來越多的數(shù)據(jù)庫會考慮納入向量搜索功能,以滿足當前用戶群的需求。對于目前缺乏向量搜索功能的數(shù)據(jù)庫,實現(xiàn)這些功能或許只是時間問題。

也有聲音認為,相較于大模型的高調火熱,向量數(shù)據(jù)庫仍然靠近底層,并沒有達到真正意義上的全民皆知,向量數(shù)據(jù)庫更多時候是需要集成到其他平臺或云上被銷售。

而從需求端看,過去向量檢索還主要聚焦于機器學習和數(shù)據(jù)挖掘領域,通過高效的數(shù)據(jù)存儲和查詢工具,使得相似性搜索和聚類分析成為可能。

在推薦系統(tǒng)中,向量數(shù)據(jù)庫助力個性化推薦,根據(jù)用戶興趣和商品相似性,呈現(xiàn)給用戶最貼切的推薦結果。

簡言之,“與其投資新的向量數(shù)據(jù)庫項目,不如集中精力于現(xiàn)有數(shù)據(jù)庫,并探索利用向量引擎增強這些數(shù)據(jù)庫的機會,使其更加健壯和強大”。

04

 結語

無論如何,在技術的快速迭代下,數(shù)據(jù)庫市場的持續(xù)擴張是不可避免的。當前存在著大量的需求,將吸引越來越多的數(shù)據(jù)庫甚至向量數(shù)據(jù)庫加入競爭。

不過從長遠來看,向量數(shù)據(jù)庫的市場需求尚處于初期,中遠期規(guī)模尚難以預估。在若干輪優(yōu)勝劣汰之后,我們或許才能看清誰是真正的執(zhí)棋者。

編者按:本文轉載自微信公眾號:科技云報到(ID:ITCloud-BD),作者:科技云報道 

本文來源科技云報到,內(nèi)容僅代表作者本人觀點,不代表前瞻網(wǎng)的立場。本站只提供參考并不構成任何投資及應用建議。(若存在內(nèi)容、版權或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p4 q0 我要投稿

分享:

品牌、內(nèi)容合作請點這里:尋求合作 ››

前瞻經(jīng)濟學人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領導者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領域解決方案,掃一掃關注。

前瞻數(shù)據(jù)庫
企查貓
前瞻經(jīng)濟學人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟學家互動交流讓您成為更懂趨勢的人

研究員周關注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟學人》APP提問

 
在線咨詢
×
在線咨詢

項目熱線 0755-33015070

AAPP
前瞻經(jīng)濟學人APP下載二維碼

下載前瞻經(jīng)濟學人APP

關注我們
前瞻產(chǎn)業(yè)研究院微信號

掃一掃關注我們

我要投稿

×
J
主站蜘蛛池模板: 青草久久久久 | 激情网站网址 | 一区二区视频免费看 | 美女自卫慰黄网站 | 欧美日韩国产在线 | 国产高潮成人免费视频在线观看 | 亚洲美女一区 | 国产激爽大片高清在线观看 | 特级淫片女子高清视频在线观看 | 亚洲综合久久av一区二区三区 | 亚洲精品尤物av在线观看任我爽 | 新婚之夜玩弄人妻系列 | 女人内精69xxxxx免费软件 | 免费做爰猛烈吃奶摸视频在线观看 | 中文字幕一区二区视频 | aⅴ在天堂线网在线观看 | 麻豆精品国产91久久久久久 | 欧美2区 | 好男人WWW社区视频在线资源 | 99亚洲男女激情在线观看 | 观月雏乃qvod| 三年中文在线观看免费大全 | 中文字幕亚洲天堂 | 在线免费视频a | 亚洲大尺度无码专区尤物 | 免费在线看黄 | 免费无码一区二区三区 | 天天做天天爱夜夜爽毛片L 亚洲AV国产AV一区无码 | 好男人网官网在线观看2019 | 波多野结AV衣东京热无码专区 | 欧美三极| 国产精品久久久久久久日韩 | 91精品久久久久久9s密挑 | 亚洲国产精品高潮呻吟久久 | 日日操夜夜草 | 少妇人妻综合久久中文字幕888 | 亚洲网站www| 强壮公弄得小薇高潮 | 91系列在线观看 | 91久久久久久久 | 久久精品国产精品亚洲综合 |