一周焦點(diǎn)

1、聚焦北京智源大會(huì)：AI安全監(jiān)管迫在眉睫；名人焦點(diǎn)言論；

2、蘋(píng)果大事件—MR引入腦機(jī)接口進(jìn)行行為預(yù)測(cè)；iOS17引入大語(yǔ)言模型；

(資料圖片僅供參考)

3、大模型：

國(guó)產(chǎn)大模型—悟道3.0全面開(kāi)源比GPT-4算數(shù)能力更強(qiáng)的GOAT大模型靈活調(diào)用各種API的Gorilla模型MetaVL開(kāi)啟下一個(gè)多模態(tài)時(shí)代GPT寫(xiě)指令的程序-PromptAppGPT

4、AI應(yīng)用：

Stability AI又放大招，核彈級(jí)更新一鍵擴(kuò)圖Tafi3D角色生成引擎重磅來(lái)襲，游戲、影視動(dòng)畫(huà)創(chuàng)作將直接受益AI醫(yī)療-Carbon Health的新AI工具，創(chuàng)建醫(yī)療記錄

見(jiàn)智視角

北京智源大會(huì)堪比AI界春晚

轟轟烈烈的2023智源大會(huì)，可以說(shuō)是本年度國(guó)內(nèi)AI領(lǐng)域規(guī)格最高的、最受矚目的大會(huì)。眾多AI圈知名創(chuàng)始人和專(zhuān)家紛紛發(fā)表了言論。

總得來(lái)看，關(guān)注度最高的還是AI的安全性，人工智能正以爆發(fā)式的速度發(fā)展，未來(lái)十年可能就會(huì)出現(xiàn)超強(qiáng)AI。而對(duì)AI的風(fēng)險(xiǎn)監(jiān)管等級(jí)高到要建議成立類(lèi)似國(guó)際原子能機(jī)構(gòu)的組織。

OpenAI的創(chuàng)始人Sam Altman提出兩種監(jiān)管方式：一是可擴(kuò)展監(jiān)督，嘗試用AI系統(tǒng)協(xié)助人類(lèi)監(jiān)督其他人工智能系統(tǒng)。二是可解釋性，嘗試?yán)斫獯竽Ｐ蛢?nèi)部運(yùn)作「黑箱」。

其次，大模型的開(kāi)源是必然的發(fā)展路徑。

這個(gè)觀(guān)點(diǎn)見(jiàn)智也曾多次在日?qǐng)?bào)\周報(bào)中進(jìn)行過(guò)分析，對(duì)于政務(wù)、金融等行業(yè)應(yīng)用視角來(lái)看，模型的安全高于一切，必然不可能采用長(zhǎng)期處于封閉訓(xùn)練的大模型作為通用大模型。Sam Altman也表示，openAI未來(lái)會(huì)有更多開(kāi)源。

名人焦點(diǎn):

“AI教父”Geoffrey Hinton在2023北京智源大會(huì)上發(fā)言焦點(diǎn):

1、人工神經(jīng)網(wǎng)絡(luò)很快會(huì)比真正的神經(jīng)網(wǎng)絡(luò)更強(qiáng)大嗎？會(huì)，且很快會(huì)發(fā)生。
2、算力成為了AI發(fā)展的阻礙，"activity perturbation"的算法可以用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)，且節(jié)省算力。
3、超級(jí)智能控制問(wèn)題非常重要，希望年輕一代的研究人員能夠找到解決方案，使超級(jí)智可以為人類(lèi)帶來(lái)更好的生活同時(shí)又不會(huì)剝奪人類(lèi)的控制權(quán)。
4、AI會(huì)欺騙人類(lèi)，且發(fā)現(xiàn)操縱人來(lái)獲得更多的權(quán)力很容易。

Midjourney創(chuàng)始人David Holz在2023北京智源大會(huì)上發(fā)言焦點(diǎn):

1、?Midjourney的目標(biāo)之一是建造新的人類(lèi)基礎(chǔ)設(shè)施；使用midjourney不僅僅是學(xué)習(xí)如何使用這個(gè)工具，而是學(xué)習(xí)所有的藝術(shù)和歷史：
2、?用戶(hù)界面友好可以讓人工智能變成用戶(hù)們自思維的一種延伸；
3、?當(dāng)前世界害怕人工智能很正常，但同時(shí)，人們又不想要一個(gè)缺乏智慧的世界：

“索羅斯戰(zhàn)友”、傳奇投資人Stanley Druckenmiller再度力挺AI:

斯坦利·德魯肯米勒（Stanley Druckenmiller）日前表示：人工智能可以像互聯(lián)網(wǎng)一樣具有創(chuàng)新性。如果對(duì)AI的判斷正確，會(huì)再持有英偉達(dá)兩到三年、甚至更長(zhǎng)時(shí)間這一立場(chǎng)，這與羅斯柴爾德家族對(duì)英偉達(dá)的高位減持形成對(duì)比。

字節(jié)跳動(dòng)創(chuàng)始人張一鳴在香港成立了一個(gè)個(gè)人投資基金Cool River Venture，主要聚焦科技投資，尤其是AI領(lǐng)域。

蘋(píng)果大事件

在iOS17中加入transformer語(yǔ)言模型，用于提高文字和語(yǔ)音轉(zhuǎn)文字時(shí)的準(zhǔn)確性。

見(jiàn)智研究觀(guān)點(diǎn):

蘋(píng)果使用transformer模型用于一些基礎(chǔ)應(yīng)用符合蘋(píng)果一直以來(lái)的務(wù)實(shí)精神，蘋(píng)果從不強(qiáng)調(diào)某項(xiàng)技術(shù)是否先進(jìn)，而是要在用戶(hù)體驗(yàn)上做到極致。這也是蘋(píng)果一直強(qiáng)調(diào)技術(shù)落地到應(yīng)用的體現(xiàn)。預(yù)計(jì)蘋(píng)果設(shè)備在明年將會(huì)擁有自己的llm模型，而這個(gè)模型按照蘋(píng)果一貫的隱私保護(hù)模式，應(yīng)為純本地化的模型。

Vision Pro里用了“腦機(jī)”，通過(guò)檢測(cè)眼睛準(zhǔn)確預(yù)測(cè)用戶(hù)下一步要做什么

見(jiàn)智研究觀(guān)點(diǎn):

蘋(píng)果通過(guò)全新的神經(jīng)技術(shù)對(duì)人的行為進(jìn)行預(yù)測(cè)，從而大幅減小了vision產(chǎn)品整個(gè)UI操作的延遲，大幅提升用戶(hù)體驗(yàn)。從無(wú)數(shù)細(xì)節(jié)中可以看到，蘋(píng)果在用搬山能力處理每一個(gè)細(xì)節(jié)，這個(gè)軟硬整合能力，不是誰(shuí)能可以隨便模仿的，它所體現(xiàn)的每一個(gè)細(xì)節(jié)，都看出蘋(píng)果花費(fèi)巨大的功夫在解決交互體驗(yàn)。這也是蘋(píng)果之所以偉大的地方。

大模型

1、國(guó)產(chǎn)大模型—悟道3.0全面開(kāi)源

繼智源悟道大模型項(xiàng)目連創(chuàng)中國(guó)首個(gè)+世界最大紀(jì)錄之后，悟道3.0進(jìn)入全面開(kāi)源的新階段。悟道3.0是一個(gè)大模型系列。具體來(lái)說(shuō)，包括悟道·天鷹（Aquila）語(yǔ)言大模型系列、天秤（FlagEval）大模型評(píng)測(cè)體系、「悟道·視界」視覺(jué)大模型系列，以及多模態(tài)大模型系列。

見(jiàn)智研究觀(guān)點(diǎn):

特別值得關(guān)注的是國(guó)產(chǎn)大模型的優(yōu)勢(shì)在于中文語(yǔ)料，并且是安全合規(guī)的數(shù)據(jù)庫(kù)。比如悟道·天鷹就是中英雙語(yǔ)大模型，不只能生成中文，還能讀懂大量的中文世界的原生知識(shí)（放了近40%的中文語(yǔ)料）；并且由于規(guī)模小，該模型在消費(fèi)級(jí)顯卡上就支持運(yùn)行，方便C端用戶(hù)訓(xùn)練。

2、比GPT-4算數(shù)能力更強(qiáng)的GOAT大模型

新加坡發(fā)布AI模型，算數(shù)能力強(qiáng)于GPT-4新加坡國(guó)立大學(xué)推出了Goat模型，稱(chēng)該AI模型“專(zhuān)門(mén)用于算術(shù)問(wèn)題”。研究人員表示，"在對(duì)LLaMA模型進(jìn)行微調(diào)后，Goat在算數(shù)上實(shí)現(xiàn)了比GPT-4更高的準(zhǔn)確度與更出色的性能。

見(jiàn)智研究觀(guān)點(diǎn):

專(zhuān)用領(lǐng)域的AI模型將會(huì)此起彼伏的出現(xiàn)，在通用模型的基礎(chǔ)上進(jìn)行專(zhuān)用數(shù)據(jù)的投喂和訓(xùn)練，很容易實(shí)現(xiàn)高于通用大模型的專(zhuān)項(xiàng)水平。未來(lái)還會(huì)有更多行業(yè)會(huì)采用這種方式進(jìn)行AI模型訓(xùn)練，包括金融、政府等領(lǐng)域；比如微軟開(kāi)始向美國(guó)政府提供GPT-4和GPT-3兩個(gè)大型語(yǔ)言模型的聊天機(jī)器人技術(shù)，未來(lái)可以基于Azure云服務(wù)進(jìn)行專(zhuān)項(xiàng)模型訓(xùn)練。

3、靈活調(diào)用各種API的Gorilla模型

UC伯克利華人博士生做了一個(gè)以大猩猩命名的Gorilla模型，可以靈活調(diào)用各種API，性能超過(guò)GPT-4。API的功能是一種通用語(yǔ)言，使不同的系統(tǒng)之間能夠進(jìn)行有效地溝通，正確使用API可以提高LLM與更廣泛的工具進(jìn)行互動(dòng)的能力。

見(jiàn)智研究觀(guān)點(diǎn):

API調(diào)用一直是LLM大模型最具有挑戰(zhàn)對(duì)的任務(wù)之一，主要是由于無(wú)法生成準(zhǔn)確的輸入?yún)?shù)，并且LLM容易對(duì)API調(diào)用的錯(cuò)誤使用產(chǎn)生幻覺(jué)。Gorilla的優(yōu)勢(shì)在于理解和推理約束能力，并且還能夠大大緩解了LLM會(huì)經(jīng)常遇到的幻覺(jué)問(wèn)題，使得檢索反饋結(jié)果的準(zhǔn)確性更高。

4、MetaVL: 將上下文學(xué)習(xí)能力從語(yǔ)言模型遷移到視覺(jué)，開(kāi)啟下一個(gè)多模態(tài)時(shí)代

實(shí)驗(yàn)證明，跨模態(tài)的上下文學(xué)習(xí)能力可以轉(zhuǎn)移，該模型顯著提高了視覺(jué)-語(yǔ)言任務(wù)上的上下文學(xué)習(xí)能力，并且在模型大小方面能夠有顯著的優(yōu)化，例如在VQA、OK-VQA和GQA上，所提出方法在參數(shù)數(shù)量減少約20倍的情況下超過(guò)了基準(zhǔn)模型。

見(jiàn)智研究觀(guān)點(diǎn):

上下文學(xué)習(xí)能力從單模態(tài)遷移到多模態(tài)的可能性，證明了在視覺(jué)-語(yǔ)言任務(wù)中通過(guò)遷移可以顯著提升上下文學(xué)習(xí)能力，甚至在模型大小方面實(shí)現(xiàn)優(yōu)化。這意味著多模態(tài)情況下的對(duì)話(huà)能力將得到加強(qiáng)，對(duì)于現(xiàn)有的文生圖來(lái)說(shuō)可能會(huì)帶來(lái)新的變化，生成模式對(duì)用戶(hù)將更友好。

5、給GPT寫(xiě)指令的APP

CCF理論計(jì)算機(jī)科學(xué)技術(shù)委員會(huì)委員張長(zhǎng)旺，開(kāi)發(fā)了一個(gè)基于低代碼提示語(yǔ)的快速應(yīng)用開(kāi)發(fā)框架PromptAppGPT，可以實(shí)現(xiàn)基于GPT的自然語(yǔ)言快速應(yīng)用開(kāi)發(fā)。

見(jiàn)智研究觀(guān)點(diǎn):

ChatGPT能夠發(fā)揮多少能力，很大程度上取決于Prompt的質(zhì)量。Prompt是指用戶(hù)在發(fā)起對(duì)話(huà)時(shí)輸入的初始消息，作為與模型進(jìn)行交互的指令方式。所以這是為什么現(xiàn)在都在學(xué)習(xí)Prompt的核心原因。

而PromptAppGPT的推出能夠幫助用戶(hù)大大提高效率，提供多任務(wù)條件觸發(fā)、結(jié)果驗(yàn)證和失敗重試能力，可以讓原本需要多步驟的手動(dòng)生成任務(wù)變成自動(dòng)完成，不需要自己記憶和輸入繁瑣的Prompt咒語(yǔ)，只輸入任務(wù)核心必要信息就可以輕松完成任務(wù)。

應(yīng)用

1、Stability AI又放大招，核彈級(jí)更新一鍵擴(kuò)圖

AI修圖繼續(xù)開(kāi)卷，PS平替Uncrop Clipdrop一鍵擴(kuò)圖+重構(gòu)圖片。

Stability AI又又又更新了，它聯(lián)合Clipdrop推出了Uncrop Clipdrop——一個(gè)終極圖像比例編輯器。通過(guò)創(chuàng)建擴(kuò)展背景，這個(gè)工具可以補(bǔ)充任何現(xiàn)有照片或圖像，來(lái)更改任何圖像的比例。

見(jiàn)智研究觀(guān)點(diǎn):

AI作圖圈幾乎每周都會(huì)有重磅更新，之前我們也持續(xù)對(duì)AI作圖產(chǎn)品和工具進(jìn)行更新，上周還有谷歌定制大師StyleDrop又來(lái)炸場(chǎng)。AI作圖可以說(shuō)是AI應(yīng)用內(nèi)卷最嚴(yán)重的賽道了，無(wú)論是巨頭還是小廠(chǎng)都將作圖大戰(zhàn)進(jìn)行到了白熱化的階段。從這個(gè)節(jié)奏來(lái)看，無(wú)疑是對(duì)用戶(hù)端的最大利好，未來(lái)AI高質(zhì)量作圖免費(fèi)也會(huì)成為常態(tài)化趨勢(shì)。

2、強(qiáng)大的3D角色生成引擎重磅來(lái)襲，游戲、影視動(dòng)畫(huà)創(chuàng)作將直接受益

Tafi一家領(lǐng)先的3D數(shù)字內(nèi)容和軟件提供商剛剛宣布推出一款突破性的文本轉(zhuǎn)3D角色引擎，該引擎將改變藝術(shù)家、開(kāi)發(fā)人員和其他專(zhuān)業(yè)人士的創(chuàng)作過(guò)程。僅基于簡(jiǎn)單的文本輸入，即可在幾分鐘內(nèi)輕松生成高質(zhì)量的3D角色。生成數(shù)百億種獨(dú)特的 3D 角色變體。將角色直接導(dǎo)出到Blender，Unreal或Unity。

見(jiàn)智研究觀(guān)點(diǎn):

該款引擎的推出極大的解決了3D創(chuàng)作中最困難的部分，將使得3D角色創(chuàng)造成本更低。傳統(tǒng)的視覺(jué)訓(xùn)練模型渲染非常耗費(fèi)時(shí)間，而Tafi的這款基于自然語(yǔ)言文本生成自定義 3D 字符的引擎不僅僅使得每一個(gè)3D角色都是獨(dú)一無(wú)二的，更重要的創(chuàng)作時(shí)間縮短到只要幾分鐘。這對(duì)于游戲NPC、影視動(dòng)畫(huà)角色的創(chuàng)建帶來(lái)極大的降本增效。

3、Carbon Health的新AI工具通過(guò)生成記錄和計(jì)費(fèi)代碼來(lái)減少醫(yī)生的工作量

采用GPT來(lái)創(chuàng)建醫(yī)療記錄不僅僅是能夠提高醫(yī)生的工作效率，同時(shí)還能夠有助于提供更加標(biāo)準(zhǔn)化和一致的醫(yī)療記錄，這對(duì)于不同醫(yī)院病歷之間的協(xié)作和信息共享非常重要。

見(jiàn)智研究觀(guān)點(diǎn):AI工具還能夠?yàn)獒t(yī)生提供有關(guān)患者護(hù)理的指南和建議，基于大量的醫(yī)療知識(shí)和數(shù)據(jù)。這有助于醫(yī)生做出更準(zhǔn)確、更綜合的診斷和治療決策，提高患者的治療效果。

但仍需注意的是：盡管AI在醫(yī)療記錄方面具有很多優(yōu)勢(shì)，但它并不能完全取代醫(yī)生的專(zhuān)業(yè)判斷和臨床經(jīng)驗(yàn)。

下周關(guān)注

360智腦發(fā)布會(huì)定檔6月13日。

風(fēng)險(xiǎn)提示及免責(zé)條款市場(chǎng)有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議，也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資，責(zé)任自負(fù)。

關(guān)鍵詞：