通用與垂直大模型之戰:大模型驅動的商業智能變革之路
圖源:攝圖網
作者|科技云報道 來源|科技云報到(ID:ITCloud-BD)
是做通用大模型還是垂直大模型,這一個爭論在“百模大戰”的下討論愈發熱烈。
目前,以微軟、谷歌、百度、阿里等為代表的發力于通用大模型的科技大廠,也都開始推動大模型在垂直領域的商業化落地。
比如說,微軟和谷歌已將大模型技術融入操作系統、文檔、搜索和郵件等產品中,展現了強大的實用價值。
垂直大模型則更為直接的深入特定行業和應用場景,如金融、醫療或零售等,相比于通用大模型,垂直大模型能夠更精準地滿足行業特定的需求。
說到底,無論是通用還是垂直大模型,其核心點還是落地場景和商業化。大模型重新定義了人工智能的邊界和可能性,但更需要的是,在具體的商業環境中找到了新的生存空間和增長點。
在眾多垂直領域中,大模型在智能商業BI領域落地尤為引人注目。作為商業決策的關鍵支撐工具,傳統的BI在大數據時代已顯得力不從心。
垂直大模型的加入,對話式BI的實現,則為BI帶來了前所未有的可能性。
數據分析不再是特定專業人員的保留節目,通過對話式BI,企業每一位員工都可以通過自然語言與系統互動,得到更直觀、更個性化的洞察。
01
從傳統BI到對話式BI
第一個需要弄清楚的問題是,商業智能(BI)是什么?
商業智能(Business Intelligence,簡稱BI)是一套解決方案,通過分析、挖掘、整合和展示企業內外的大量非結構化數據,為決策者提供指導和支持。
具體來說,BI是一套完整的由數據倉庫、查詢報表、數據分析等組成的數據類技術解決方案,能夠實現業務流程和業務數據的規范化、流程化、標準化,打通ERP、OA、CRM等不同業務信息系統,整合歸納企業數據。
BI可以幫助企業深入了解自身運營狀況,監測業務流程,掌握市場動態,并基于數據分析來制定戰略和戰術。
比如BI可以制作滿足不同部門、不同層級員工的數據可視化報表,可以幫助一線業務人員實現業務的追蹤、預測、復盤等操作;也可以幫助企業高層管理人員,通過商業智能BI的管理駕駛艙、核心KPI指標、集團看板等.
然而,傳統的BI系統常常復雜且難以使用,需要通過專業人員來操作和解讀。這其中的時間延遲和技能門檻成為了效率和普及的障礙。
另外,數字化時代,無論產品研發、市場營銷、財務管理還是客戶服務,在經營各環節使用數據支撐決策已成為企業的日常,企業數據分析需求量大幅度上升。
同樣,企業的管理者還是普通財務甚至是業務人員都需要利用BI來進行更高效的數據分析和決策。
對話式BI的出現,正是為了解決這些問題和需求。
與傳統BI系統相比,對話式BI采用自然語言處理技術,允許用戶通過自然語言詢問,就像與人類分析師對話一樣,從而獲取所需信息。這一交互方式大大降低了使用門檻,提高了效率。
普及性與便利性:對話式BI不需要專業的技能和培訓,讓更多人員可以直接訪問和利用企業的數據資源。
實時性與靈活性:對話式查詢允許用戶實時獲取信息,快速響應臨時或緊急需求,增強了企業的靈活性和響應能力。
個性化與智能化:通過智能大模型,對話式BI能夠理解復雜的查詢,并根據個人的需求和背景提供定制化的解答。
集成與擴展能力:對話式BI可以更容易地與其他系統集成,為企業提供更廣泛的應用場景和擴展可能性。
對話式BI的崛起并不是偶然的現象,而是商業智能發展的必然趨勢。它體現了現代企業對數據分析的迫切需求,以及對便捷、智能和高效工具的追求。
隨著這一領域的不斷創新和發展,對話式BI將成為未來企業決策支持的重要方向。
02
可信度挑戰
雖然對話式BI提高了效率,但基于通用大模型的對話式BI,其答案的可信度卻成了問題。
類ChatGPT產品并不能帶來完全準確的回答,主要原因在于兩點:首先,類ChatGPT產品更擅長處理自然語言文本數據相關任務,并非專門為數據分析而設計;其次,通用大模型可能存在捏造事實,也即“AI幻覺”。
一些產品可能存在所謂的“AI幻覺”。在BI領域可能是捏造字段,這在數據分析中可能成為致命問題。
為了解決這一問題,一些公司正在積極尋找解決方案。例如,網易數帆最近發布的有數ChatBI產品,就強調在需求理解、過程驗證、用戶干預和產品運營四個方面確保數據的可信。
網易數帆大數據產品線總經理余利華認為,AI幻覺的產生是由于訓練數據不足、文本與表示之間的編解碼錯誤等因素,可怕的是AI并不知道這是幻覺,單靠Prompt(提示)來糾正極為困難。
對此,網易數帆打造可信的有數ChatBI的核心點在于:需求可理解,過程可驗證,用戶可干預,產品可運營。
需求可理解,是指網易數帆為彌補用戶認知和復雜工具之間的門檻,提升準確率,借助大模型的語言理解能力,先進行需求分析,這樣即使是完全不懂BI的使用者也能通過需求分析內容判斷系統的取數步驟是否正確。
過程可驗證,即借助基于大模型的NL2SQL能力實現復核。為了提升NL2SQL能力,網易數帆有針對性地定制生成和優化了超過30萬不同類型的問法和SQL。
余利華介紹,網易數帆調優出的NL2SQL領域模型,效果已達到GPT-3.5的水平。
用戶可干預,即將數據模型和查詢條件結構化,用戶可干預可調整,切換數據模型或者查詢條件。
產品可運營,即網易數帆為有數ChatBI產品構建了獨特的運營反饋機制,用戶可以反饋數據的準確性,管理員可運營知識庫、標記及優化badcase,從而提升數據可靠性。
僅僅依靠分析領域具備GPT-3.5實力的NL2SQL模型,并不能保證對話式BI返回100%正確的結果,產品的設計對于落地顯得尤為重要。
余利華表示,有數ChatBI實現可信的關鍵,是讓用戶在結果錯誤的時候能夠認識到那是錯的,并通過人工干預得到正確的結果。
在實際應用中,以大型連鎖超市的銷售部門場景為例,產品人員輸入“我想看今年上半年華北地區每個月的利潤”,有數ChatBI可給出相應結果,并用自然語言描述了查詢的邏輯與步驟。
掌握SQL的專業人員可以點擊“更多”按鈕查看對應的SQL。如果邏輯有誤,例如用戶想看“訂單日期”在上半年的數據,但是AI篩選的是“發貨日期”,用戶可點擊“修改查詢條件”進行對校正。
據網易數帆透露,目前,有數ChatBI在網易公司的應用,已經覆蓋產品、運營、市場、財務等非技術人員。
03
尋找通用與
垂直大模型的平衡點
回到開頭通用和垂直大模型的討論上。
這一次,有記者在網易數帆城市行媒體溝通環節將這個問題拋給了網易。
網易副總裁、網易杭州研究院執行院長、網易數帆總經理汪源對此表示:網易目前的實際情況是既做通用的大模型,也做垂直的大模型,這兩者之間是支撐的關系,最終的出口是做垂類的模型,從企業服務市場的角度,應用在軟件開發和數據分析這兩個最關注的領域。
為了實現這一目標,網易團隊構建了一個“公共底座”——網易“玉言”大模型。該模型由網易伏羲實驗室和杭研的人工智能團隊共同推動,后期還將加入更多業務團隊共同打造網易集團的大模型底座。
這一次在BI產品上的探索同樣做到了在通用和垂直大模型上尋找平衡點。結合通用和垂直模型將有助于提升對話式BI的準確性和適用性,打破了傳統商業智能的局限,開啟了新的可能。
在大模型掀起的新時代里,許多企業都站在了一個十字路口,開始尋找通用大模型與垂直行業大模型之間的平衡。
通用模型以其強大的語言理解能力為人們提供了廣泛的應用前景,而針對特定行業或需求的垂直模型則能更精準地滿足實際要求。
實際上,通用和垂直大模型并不是孤立的存在,它們之間的協同作用可能正是推動商業智能向更高層次發展的關鍵。
通過精準地結合兩者的優勢,企業不僅能滿足現實需求,還能為未來創新鋪設堅實的基礎。
未來,這一平衡的探索將更多地體現在產品設計和技術創新中。
通用模型可能會繼續拓展其在各個領域的應用,同時垂直模型將更加聚焦于某些關鍵行業,如金融、醫療和教育等。這兩者的結合將為實現更智能、更人性化的交互和服務打開新的大門。
從長遠看,通用與垂直大模型的協同可能將推動人工智能技術的下一個里程碑。
是否可以在維持通用性的同時,達到針對特定需求的最優解?這不僅是一個技術問題,也涉及到產業戰略、商業模式和倫理考量。
隨著更多企業和研究機構的共同努力,尋找通用和垂直大模型的平衡點將成為推動商業智能持續創新和高質量發展的關鍵。
這一過程將揭示人工智能如何真正融入我們的日常生活和工作,為人類帶來前所未有的便利和機遇。
04
結語
對話式商業智能代表了BI領域的一個新方向,其自然的交互方式和快速的響應時間正在改變企業的數據分析方式。
然而,隨之而來的可信度挑戰需要整個行業共同努力解決。
未來,通過更多的研發投入、跨企業合作以及對通用和垂直模型的深入研究,我們有望見到更加精確、可信和高效的對話式商業智能產品,推動整個商業分析領域向前發展。
編者按:本文轉載自微信公眾號:科技云報到(ID:ITCloud-BD),作者:科技云報道
前瞻經濟學人
專注于中國各行業市場分析、未來發展趨勢等。掃一掃立即關注。