OpenAI最強“企業(yè)版”炸場,B端大模型市場會“贏家通吃”嗎?
速度翻倍、安全加密、調用GPT-4無上限,今天凌晨,OpenAI官宣的企業(yè)專用版ChatGPT堪稱“最強ChatGPT版本”!
同普通版ChatGPT相比,企業(yè)版性能更加強大,包括:提供無限制的GPT-4訪問,速度提升2倍,支持無限制高級數(shù)據(jù)分析,支持可用于4倍輸入和文件的32k Tokens上下文窗口,提供可共享的聊天模板和免費的API接口、保證企業(yè)的數(shù)據(jù)隱私和安全等。
(資料圖片僅供參考)
除了目前適合大型企業(yè)的版本之外,OpenAI還將很快推出適用于各類小型團隊的自助式 ChatGPT Business 產品,服務于所有規(guī)模和類型的組織。也就是說,從今天開始,OpenAI已然吹響了向B端市場全面進攻的號角。
自然,這就帶來了一個問題:面向企業(yè)的B端AI大模型市場,會“贏家通吃”嗎?
最近,美國光速創(chuàng)投(Lightspeed Venture Partners)合伙人Guru Chahal深度分析了這一問題。
作者認為,B端最有可能的路徑,是企業(yè)在探索階段使用大型模型,隨著在實際使用中對大模型理解的加深,逐漸轉向生產階段使用更小型、專業(yè)化(調整+精煉)的模型。
Chahal還提到了企業(yè)在選擇模型時需要考慮的因素,以及AI基礎設施的發(fā)展機遇,包括評估框架、模型運行與維護、增強系統(tǒng)、運維工具、數(shù)據(jù)利用等各個方面。
文章干貨很足,相信對想了解B端AI市場、AI基礎設施、未來機遇等方面的朋友一定大有裨益。
以下為全文內容,大家enjoy~??
目錄:
●?大模型生態(tài)系統(tǒng)分類
● 將用例與模型匹配
● 未來機遇在何方
在過去的十數(shù)年里,作為Lightspeed團隊一員,我親歷了人工智能和機器學習領域的驚人創(chuàng)新,這主要歸功于我們與卓越創(chuàng)業(yè)者的深度合作。
現(xiàn)在,我們與他們的公司、所構建的平臺,以及服務的客戶進一步合作交流,以便更系統(tǒng)地了解企業(yè)如何思考生成式AI。
具體來說,我們深入探究了大模型生態(tài)系統(tǒng),嘗試探討諸如“性能最強大模型是否會贏家通吃?”、“企業(yè)在使用時是否會一味依賴OpenAI的API,還是選擇更加多樣化的實際用例?”這一類問題。
這些問題的答案,將決定該未來大模型生態(tài)系統(tǒng)的增長方向,以及算力、人才和資金的流向。
大模型生態(tài)系統(tǒng)分類
根據(jù)我們的研究,我們認為,人工智能領域正在經歷一次“寒武紀式”的模型大爆發(fā)。未來,開發(fā)者和企業(yè)將根據(jù)實際需求選擇最適合的模型,盡管在探索階段的使用的可能更加集中。
B端最有可能的路徑,是企業(yè)在探索階段使用大型模型,隨著在實際使用中對大模型理解的加深,逐漸轉向生產階段使用更小型、專業(yè)化(調整+精煉)的模型。
下圖展示了我們對基礎模型生態(tài)系統(tǒng)演化的看法。
我們認為,人工智能模型領域可以分為三個主要、但又有些交叉的類別:
類別1:巨腦模型?
這些是最優(yōu)秀的模型,也是模型領域的先驅。它們產生了令人驚嘆的演示效果,深深吸引了我們的注意。當開發(fā)者試圖探索人工智能對其應用的潛力極限時,這些模型往往是默認的起點。
這些模型的訓練成本高,維護和擴展復雜。但同一個模型可以應對法學院入學考試(LSAT)、醫(yī)學院入學考試(MCAT),撰寫高中論文,并像聊天機器人朋友一樣與你互動。目前,開發(fā)者正在這些模型上進行實驗,并評估在企業(yè)應用中的人工智能使用情況。
需要注意的是,這些模型的使用成本高,推理延遲較大,并且在明確定義的受限用例中可能過于復雜。
同時,這些模型是通用模型,可能在專業(yè)任務上不夠準確(例如,參見康奈爾大學等的綜合研究)。
而且,它們也是黑匣子,可能給企業(yè)帶來隱私和安全挑戰(zhàn),企業(yè)正在探索如何在不泄露數(shù)據(jù)的情況下利用這些模型。
OpenAI、Anthropic、Cohere都屬于這一類別。
類別2:挑戰(zhàn)者模型?
這些模型同樣具有高能力,僅次于領先模型。Llama 2和Falcon是這一類別中的佼佼者。它們通常與類別1模型中的“N-1”或“N-2”模型一樣優(yōu)秀。
據(jù)某些基準測試,Llama 2?甚至與GPT-3.5-turbo相媲美。通過在企業(yè)數(shù)據(jù)上進行調整,這些模型在特定任務上的能力可與類別1中模型相當。
其中許多模型是開源的(或非常接近)。一旦發(fā)布,它們往往會被開源社區(qū)迅速改進和優(yōu)化。
類別3:長尾模型?
這些是“專家”模型。它們專為特定目標構建,例如對文件進行分類、識別圖像或視頻中的特定屬性、識別商業(yè)數(shù)據(jù)中的模式等。這些模型靈活,訓練和使用成本低,可以在數(shù)據(jù)中心或邊緣上運行。
僅需瀏覽Hugging Face,即可窺見這一生態(tài)系統(tǒng)的廣度之大,未來還會因為它為各種用例提供服務而不斷擴大!
將用例與模型匹配
盡管尚處于早期階段,但我們已經看到一些領先的開發(fā)團隊和企業(yè)開始以這種精細的方式思考這個生態(tài)系統(tǒng)。他們渴望將用例與最適合的模型匹配,甚至可能在更復雜的用例中使用多個模型。
在選擇使用哪個/哪些模型方面,通常會考慮以下因素:
a.?數(shù)據(jù)隱私和合規(guī)要求,這會影響模型是在企業(yè)基礎架構中運行,還是數(shù)據(jù)可以發(fā)送到外部托管的推理終端。
b.?能否對模型進行微調對這個用例是否至關重要或者強烈希望進行微調。
c.?期望的推理“性能”水平(延遲、準確性、成本等)。
實際清單通常比上述內容更長,反映了開發(fā)者希望利用人工智能解決的各種多樣用例。
機遇在哪里???
這一新興生態(tài)系統(tǒng)產生了幾個重要影響:
① 評估框架:企業(yè)將需要工具和專業(yè)知識,來評估哪個模型適合哪個用例。
開發(fā)者需要決定如何最好地評估特定模型是否適合“所需工作”。評估需要考慮多個因素,不僅包括模型性能,還包括成本、可以行使的控制水平等。
② 運行和維護模型:預計將出現(xiàn)用于幫助企業(yè)訓練、微調和運行模型的平臺,特別是第三類長尾模型。
這些平臺過去通常被稱為ML Ops平臺,我們預計這個定義將擴展到包括生成式人工智能。Databricks、Weights and Biases、Tecton等平臺正在迅速朝這個方向發(fā)展。
③ 增強系統(tǒng):模型,特別是托管的LLM(檢索增強模型),需要通過增強生成提供卓越的結果。
這涉及做出次級決策,包括:
o?數(shù)據(jù)和元數(shù)據(jù)攝?。?/strong>如何連接結構化和非結構化的企業(yè)數(shù)據(jù)源,然后攝取數(shù)據(jù)以及關于訪問策略等方面的元數(shù)據(jù)。
o?生成和存儲嵌入:選擇用于為數(shù)據(jù)生成嵌入的模型。然后,如何存儲這些嵌入:根據(jù)所需性能、規(guī)模和功能選擇哪個向量數(shù)據(jù)庫?
在這里,存在機會來構建面向企業(yè)的RAG(檢索增強生成)平臺,以簡化選擇和組合這些平臺所帶來的復雜性:
①?運維工具:企業(yè)IT部門需要為工程團隊建立監(jiān)管措施,管理成本等。
與今天為軟件開發(fā)所做的所有工作一樣,他們需要擴展這些任務,以包括人工智能的使用。IT感興趣的領域包括:
o?可觀測性:模型在生產環(huán)境中的表現(xiàn)如何?它們的性能是否隨時間改善/惡化?是否存在可能影響未來應用程序版本中模型選擇的使用模式?
o?安全性:如何確保AI本地應用程序的安全性。這些應用程序是否容易受到新的攻擊方式的攻擊,需要新的平臺?
o?合規(guī)性:我們預計AI本地應用程序和LLM的使用將需要符合相關主管機構已開始制定的框架。這是除了隱私、安全、消費者保護、公平性等現(xiàn)有合規(guī)性制度之外的。企業(yè)將需要平臺來幫助他們保持合規(guī)性、進行審計、生成合規(guī)性證明等相關任務。
② 數(shù)據(jù):預計將迅速采用幫助企業(yè)了解其數(shù)據(jù)資產以及如何通過使用新型人工智能模型從這些資產中提取最大價值的平臺。
正如地球上最大的軟件公司之一曾對我們說的那樣,“我們的數(shù)據(jù)是我們的壕溝,我們的核心IP,我們的競爭優(yōu)勢?!?/p>
通過利用人工智能將這些數(shù)據(jù)貨幣化,以一種在不削弱防御能力的情況下推動“差異化”的方式,將是關鍵。Snorkel等平臺在其中發(fā)揮著關鍵作用。
我們認為,現(xiàn)在正是構建人工智能基礎設施平臺的絕佳時機。
盡管人工智能的應用將繼續(xù)改變整個行業(yè),但要想使每個企業(yè)都能采用這一強大技術,就需要支持基礎設施、中間件、安全性、可觀測性和操作平臺。
本文來源:硬AI
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據(jù)此投資,責任自負。關鍵詞: