最近幾個月，國產(chǎn)大模型的內(nèi)卷激烈程度可以用“神仙打架”來形容。本周五，大模型混戰(zhàn)又達到了新高度，據(jù)華爾街見聞不完全統(tǒng)計，僅在今天，就有華為、阿里、騰訊、商湯、京東等企業(yè)發(fā)布或更新大模型。

(資料圖片僅供參考)

“百模大戰(zhàn)”的盛況中，誰最有可能造出中國版GPT-4？

華為云盤古大模型3.0正式發(fā)布

7月7日，華為云在開發(fā)者大會2023上發(fā)布盤古大模型3.0。華為常務董事、華為云CEO張平安表示，盤古大模型3.0是完全面向行業(yè)的大模型，包括“5+N+X”三層架構(gòu)。

張平安在會上表示，盤古大模型不會作詩，只做事，將圍繞“行業(yè)重塑”“技術(shù)扎根”“開放同飛”三大創(chuàng)新方向，持續(xù)打造核心競爭力，為行業(yè)客戶、伙伴及開發(fā)者提供更好的服務。

三層架構(gòu)分別為：

L0層包括自然語言、視覺、多模態(tài)、預測、科學計算五個基礎(chǔ)大模型，提供滿足行業(yè)場景中的多種技能需求。盤古3.0為客戶提供100億參數(shù)、380億參數(shù)、710參數(shù)和1000億參數(shù)的系列化基礎(chǔ)大模型，匹配客戶不同場景、不同時延、不同響應速度的行業(yè)多樣化需求。同時提供全新能力集，包括NLP大模型的知識問答、文案生成、代碼生成，以及多模態(tài)大模型的圖像生成、圖像理解等能力，這些技能都可以供客戶和伙伴企業(yè)直接調(diào)用。無論多大參數(shù)規(guī)模的大模型，盤古提供一致的能力集。
L1層是N個行業(yè)大模型，華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓練的行業(yè)通用大模型，包括政務，金融，制造，礦山，氣象等大模型；也可以基于行業(yè)客戶的自有數(shù)據(jù)，在盤古大模型的L0和L1層上，為客戶訓練自己的專有大模型。
L2層為客戶提供了更多細化場景的模型，更加專注于政務熱線、網(wǎng)點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業(yè)應用或特定業(yè)務場景，為客戶提供“開箱即用”的模型服務。

盤古大模型采用完全的分層解耦設(shè)計，可以快速適配、快速滿足行業(yè)的多變需求?？蛻艏瓤梢詾樽约旱拇竽Ｐ图虞d獨立的數(shù)據(jù)集，也可以單獨升級基礎(chǔ)模型，也可以單獨升級能力集。

在L0和L1大模型的基礎(chǔ)上，華為云還為客戶提供了大模型行業(yè)開發(fā)套件，通過對客戶自有數(shù)據(jù)的二次訓練，客戶就可以擁有自己的專屬行業(yè)大模型。同時，根據(jù)客戶不同的數(shù)據(jù)安全與合規(guī)訴求，盤古大模型還提供了公用云、大模型云專區(qū)、混合云多樣化的部署形態(tài)。?

阿里AIGC應用“通義萬相”

在2023年世界人工智能大會上，阿里云正式推出AI繪畫新品“通義萬相”。

基于阿里研發(fā)的組合式生成模型Composer，通義萬相提出了基于擴散模型的「組合式生成」框架，通過對配色、布局、風格等圖像設(shè)計元素進行拆解和組合，提供了高度可控性和極大自由度的圖像生成效果。

用戶可以在通義萬相中輸入提示詞，以輸出相應圖像。除文生圖以外，通義萬相也推出了包括風格遷移、相似圖生成等功能。

從此，圖片設(shè)計的門檻將大幅降低，無論是藝術(shù)設(shè)計、游戲，還是文創(chuàng)，都將迎來一場變革。

目前，通義萬相具有以下三大功能：文生圖、相似圖生成、風格遷移。

文生圖功能為基本的形式，只要輸入prompt，選定創(chuàng)作風格（水彩、油畫、中國畫、扁平插畫、二次元、素描、3D卡通等），通義萬相就可以自動生成海量的創(chuàng)意靈感。通義萬相已正式上線，對外提供服務。

相似圖生成則可以讓用戶根據(jù)現(xiàn)有素材，快速地批量擴展相似素材。只要用戶提供一張參考圖像，就可以獲得一張與之內(nèi)容、風格類似的圖像。

而風格遷移，則是為一張原圖生成一幅指定風格的新圖。

下圖為來自“新智元”的測試，使用通義萬相將下圖穿著白紗女性，改成法國印象派畫家雷諾阿的風格。

遷移完成后，得到了這樣一幅印象派的人物肖像。

據(jù)“新智元”測評表示，通義萬相的部分作圖能力，已經(jīng)在逼近全球最牛AI作畫神器Midjourney。

騰訊MaaS平臺升級

世界人工智能大會期間，騰訊云宣布升級MaaS平臺，將行業(yè)大模型能力應用到金融風控、同傳翻譯、數(shù)智人客服等新場景中；其中，首次公布的金融風控大模型，相比傳統(tǒng)風控有10倍效率提升。

在技術(shù)底座領(lǐng)域，自研星脈高性能計算網(wǎng)絡(luò)、向量數(shù)據(jù)庫，為大模型的行業(yè)應用提供更充沛的算力基礎(chǔ)設(shè)施。其中，最新升級的騰訊云自研星脈高性能計算網(wǎng)絡(luò)，能提升40%的GPU利用率，節(jié)省30%~60%的模型訓練成本，為AI大模型帶來10倍通信性能提升?；隍v訊云新一代算力集群HCC，可支持10萬卡的超大計算規(guī)模。騰訊云AI原生向量數(shù)據(jù)庫，最高支持10億級向量檢索規(guī)模，延遲控制在毫秒級，相比傳統(tǒng)單機插件式數(shù)據(jù)庫檢索規(guī)模提升10倍，同時具備百萬級每秒查詢（QPS）的峰值能力。

在應用創(chuàng)新方面，騰訊云行業(yè)大模型能力應用到金融風控、交互翻譯、數(shù)智人客服等場景中，極大提升了智能應用效率。

行業(yè)大模型加持的金融風控解決方案，相比之前有了10倍效率提升，通過騰訊積累超過20年的黑灰產(chǎn)對抗經(jīng)驗和上千個真實業(yè)務場景，整體反欺詐效果比傳統(tǒng)模式有20%左右的提升。企業(yè)可以基于prompt模式，迭代風控能力，從樣本收集、模型訓練到部署上線，實現(xiàn)全流程零人工參與，建模時間也從2周減少到僅需2天。即便樣本積累有限的情況下，也可以完成快速搭建，跳過“冷啟動”過程。

在交互翻譯領(lǐng)域，基于行業(yè)大模型技術(shù)加持，同傳技術(shù)不再需要百萬級的訓練數(shù)據(jù)，僅需“小樣本”訓練就能實現(xiàn)較好效果，專業(yè)領(lǐng)域的翻譯也能減少人工調(diào)優(yōu)的參與，保障翻譯效果，在多個垂直行業(yè)落地。其中，騰訊同傳已經(jīng)連續(xù)六年為世界人工智能大會主論壇提供AI同傳服務。

在數(shù)智人領(lǐng)域，今年騰訊云推出了小樣本數(shù)字人工廠，僅需少量數(shù)據(jù)、24小時內(nèi)即可復刻2D數(shù)字分身，讓企業(yè)應用數(shù)智人服務成本大大降低?，F(xiàn)在，依托AI生成算法，數(shù)智人3D形象的復刻速度得到大幅提升，通過生成式動作驅(qū)動，結(jié)合行業(yè)大模型能力，可讓企業(yè)獲得更“個性化、專業(yè)、自然逼真”的數(shù)智員工，讓“面對面”專業(yè)服務成為可能。

商湯大模型全面升級

世界人工智能大會期間，在“大愛無疆·日日新”人工智能論壇上，商湯科技宣布“商湯日日新SenseNova”大模型體系將多方位全面升級，以及在該體系下的一系列大模型產(chǎn)品更新和落地成果。

作為千億級參數(shù)的自然語言處理模型，商湯商量SenseChat 2.0版本突破了大語言模型輸入長度限制，并推出不同參數(shù)量級的模型版本，可完美適配移動端、云端等不同終端及場景的應用需求，降低部署成本。商湯的自研生成式大模型商湯秒畫SenseMirage 3.0的模型參數(shù)從今年4月首次發(fā)布以來的10億提升至70億量級，能夠?qū)崿F(xiàn)專業(yè)攝影級的圖片細節(jié)刻畫。

不僅如此，商湯如影SenseAvatar 2.0數(shù)字人生成平臺相較1.0版本的語音和口型流暢度提升30%以上，實現(xiàn)4K高清視頻效果，并帶來AIGC生成形象及數(shù)字人歌唱功能。此外，商湯瓊宇SenseSpace 2.0的空間重建效率提升20%，渲染性能提升50%，每100平方公里場景的建圖時間僅需38小時即可完成（1200 TFLOPS/秒算力支持）；而商湯格物SenseThings 2.0對小物體的紋理及材質(zhì)還原達到毫米級精細度，并突破對高反光和鏡面物體的采集難題。

在金融領(lǐng)域，商湯與銀行、保險、券商等客戶展開合作，利用數(shù)字人進行智能客服、智慧營銷等工作，并通過接入大語言模型能力，提供投研分析、研報撰寫等新功能，實現(xiàn)降本增效。此外，掛載金融知識庫后，還能100%基于客戶的產(chǎn)品說明進行內(nèi)容問答輸出，并實現(xiàn)信息及時更新。

在醫(yī)療場景，商湯基于海量醫(yī)學知識和臨床數(shù)據(jù)打造了中文醫(yī)療語言大模型“大醫(yī)”，提供導診、問診、健康咨詢、輔助決策等多場景多輪會話能力，未來也即將支持醫(yī)學圖像、文本、結(jié)構(gòu)化數(shù)據(jù)等多模態(tài)綜合分析，并可不斷提升醫(yī)療語言理解和推理能力，持續(xù)賦能醫(yī)院診療效率及患者服務提升。

其他AI企業(yè)進展

本土AI獨角獸出門問問發(fā)布“序列猴子”

出門問問攜內(nèi)測探索大模型“序列猴子”及AI CoPilot解決方案亮相世界人工智能大會。據(jù)介紹，“序列猴子”是一款具備多模態(tài)生成能力的大語言模型，模型以語言為核心的能力體系涵蓋“知識、對話、數(shù)學、邏輯、推理、規(guī)劃”六個維度，能夠同時支持文字生成、圖片生成、3D內(nèi)容生成、語言生成和語音識別等不同任務?！靶蛄泻镒印本邆渥匀徽Z言理解、知識、邏輯以及推理等能力，并可以基于這些能力進行對話。

京東：正在訓練大模型，對其前景很有信心

京東集團副總裁、探索研究院院長何曉冬表示，目前訓練時間在兩個月左右的基礎(chǔ)通用大模型，成本估計在幾千萬元，對大模型的商業(yè)前景和落地場景很有信心。他建議，創(chuàng)業(yè)公司入局大模型應該找到屬于自己的“護城河”，面對目前的“百模大戰(zhàn)”現(xiàn)狀，何曉冬認為，對于市場而言，有壓力和競爭是好事，將有效促進行業(yè)發(fā)展。

風險提示及免責條款市場有風險，投資需謹慎。本文不構(gòu)成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資，責任自負。

關(guān)鍵詞：