世界快看點(diǎn)丨AI一周見(jiàn)聞:“AI界春晚”眾星齊聚智源大會(huì),Sam Altman提出兩種AI監(jiān)管方式;國(guó)產(chǎn)大模型—悟道3.0全面開(kāi)源;蘋(píng)果大事件MR引入腦機(jī)接口 | 見(jiàn)智研究
一周焦點(diǎn)
1、聚焦北京智源大會(huì):AI安全監(jiān)管迫在眉睫;名人焦點(diǎn)言論;
2、蘋(píng)果大事件—MR引入腦機(jī)接口進(jìn)行行為預(yù)測(cè);iOS17引入大語(yǔ)言模型;
(資料圖片僅供參考)
3、大模型:
國(guó)產(chǎn)大模型—悟道3.0全面開(kāi)源比GPT-4算數(shù)能力更強(qiáng)的GOAT大模型靈活調(diào)用各種API的Gorilla模型MetaVL開(kāi)啟下一個(gè)多模態(tài)時(shí)代GPT寫(xiě)指令的程序-PromptAppGPT
4、AI應(yīng)用:
Stability AI又放大招,核彈級(jí)更新一鍵擴(kuò)圖Tafi3D角色生成引擎重磅來(lái)襲,游戲、影視動(dòng)畫(huà)創(chuàng)作將直接受益AI醫(yī)療-Carbon Health的新AI工具,創(chuàng)建醫(yī)療記錄
見(jiàn)智視角
北京智源大會(huì)堪比AI界春晚
轟轟烈烈的2023智源大會(huì),可以說(shuō)是本年度國(guó)內(nèi)AI領(lǐng)域規(guī)格最高的、最受矚目的大會(huì)。眾多AI圈知名創(chuàng)始人和專(zhuān)家紛紛發(fā)表了言論。
總得來(lái)看,關(guān)注度最高的還是AI的安全性,人工智能正以爆發(fā)式的速度發(fā)展,未來(lái)十年可能就會(huì)出現(xiàn)超強(qiáng)AI。而對(duì)AI的風(fēng)險(xiǎn)監(jiān)管等級(jí)高到要建議成立類(lèi)似國(guó)際原子能機(jī)構(gòu)的組織。
OpenAI的創(chuàng)始人Sam Altman提出兩種監(jiān)管方式:一是可擴(kuò)展監(jiān)督,嘗試用AI系統(tǒng)協(xié)助人類(lèi)監(jiān)督其他人工智能系統(tǒng)。二是可解釋性,嘗試?yán)斫獯竽P蛢?nèi)部運(yùn)作「黑箱」。
其次,大模型的開(kāi)源是必然的發(fā)展路徑。
這個(gè)觀(guān)點(diǎn)見(jiàn)智也曾多次在日?qǐng)?bào)\周報(bào)中進(jìn)行過(guò)分析,對(duì)于政務(wù)、金融等行業(yè)應(yīng)用視角來(lái)看,模型的安全高于一切,必然不可能采用長(zhǎng)期處于封閉訓(xùn)練的大模型作為通用大模型。Sam Altman也表示,openAI未來(lái)會(huì)有更多開(kāi)源。
名人焦點(diǎn):
“AI教父”Geoffrey Hinton在2023北京智源大會(huì)上發(fā)言焦點(diǎn):
1、人工神經(jīng)網(wǎng)絡(luò)很快會(huì)比真正的神經(jīng)網(wǎng)絡(luò)更強(qiáng)大嗎?會(huì),且很快會(huì)發(fā)生。
2、算力成為了AI發(fā)展的阻礙,"activity perturbation"的算法可以用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),且節(jié)省算力。
3、超級(jí)智能控制問(wèn)題非常重要,希望年輕一代的研究人員能夠找到解決方案,使超級(jí)智可以為人類(lèi)帶來(lái)更好的生活同時(shí)又不會(huì)剝奪人類(lèi)的控制權(quán)。
4、AI會(huì)欺騙人類(lèi),且發(fā)現(xiàn)操縱人來(lái)獲得更多的權(quán)力很容易。
Midjourney創(chuàng)始人David Holz在2023北京智源大會(huì)上發(fā)言焦點(diǎn):
1、?Midjourney的目標(biāo)之一是建造新的人類(lèi)基礎(chǔ)設(shè)施;使用midjourney不僅僅是學(xué)習(xí)如何使用這個(gè)工具,而是學(xué)習(xí)所有的藝術(shù)和歷史:
2、?用戶(hù)界面友好可以讓人工智能變成用戶(hù)們自思維的一種延伸;
3、?當(dāng)前世界害怕人工智能很正常,但同時(shí),人們又不想要一個(gè)缺乏智慧的世界:
“索羅斯戰(zhàn)友”、傳奇投資人Stanley Druckenmiller再度力挺AI:
斯坦利·德魯肯米勒(Stanley Druckenmiller)日前表示:人工智能可以像互聯(lián)網(wǎng)一樣具有創(chuàng)新性。如果對(duì)AI的判斷正確,會(huì)再持有英偉達(dá)兩到三年、甚至更長(zhǎng)時(shí)間這一立場(chǎng),這與羅斯柴爾德家族對(duì)英偉達(dá)的高位減持形成對(duì)比。
字節(jié)跳動(dòng)創(chuàng)始人張一鳴在香港成立了一個(gè)個(gè)人投資基金Cool River Venture,主要聚焦科技投資,尤其是AI領(lǐng)域。
蘋(píng)果大事件
在iOS17中加入transformer語(yǔ)言模型,用于提高文字和語(yǔ)音轉(zhuǎn)文字時(shí)的準(zhǔn)確性。
見(jiàn)智研究觀(guān)點(diǎn):
蘋(píng)果使用transformer模型用于一些基礎(chǔ)應(yīng)用符合蘋(píng)果一直以來(lái)的務(wù)實(shí)精神,蘋(píng)果從不強(qiáng)調(diào)某項(xiàng)技術(shù)是否先進(jìn),而是要在用戶(hù)體驗(yàn)上做到極致。這也是蘋(píng)果一直強(qiáng)調(diào)技術(shù)落地到應(yīng)用的體現(xiàn)。預(yù)計(jì)蘋(píng)果設(shè)備在明年將會(huì)擁有自己的llm模型,而這個(gè)模型按照蘋(píng)果一貫的隱私保護(hù)模式,應(yīng)為純本地化的模型。
Vision Pro里用了“腦機(jī)”,通過(guò)檢測(cè)眼睛準(zhǔn)確預(yù)測(cè)用戶(hù)下一步要做什么
見(jiàn)智研究觀(guān)點(diǎn):
蘋(píng)果通過(guò)全新的神經(jīng)技術(shù)對(duì)人的行為進(jìn)行預(yù)測(cè),從而大幅減小了vision產(chǎn)品整個(gè)UI操作的延遲,大幅提升用戶(hù)體驗(yàn)。從無(wú)數(shù)細(xì)節(jié)中可以看到,蘋(píng)果在用搬山能力處理每一個(gè)細(xì)節(jié),這個(gè)軟硬整合能力,不是誰(shuí)能可以隨便模仿的,它所體現(xiàn)的每一個(gè)細(xì)節(jié),都看出蘋(píng)果花費(fèi)巨大的功夫在解決交互體驗(yàn)。這也是蘋(píng)果之所以偉大的地方。
大模型
1、國(guó)產(chǎn)大模型—悟道3.0全面開(kāi)源
繼智源悟道大模型項(xiàng)目連創(chuàng)中國(guó)首個(gè)+世界最大紀(jì)錄之后,悟道3.0進(jìn)入全面開(kāi)源的新階段。 悟道3.0是一個(gè)大模型系列。 具體來(lái)說(shuō),包括悟道·天鷹(Aquila)語(yǔ)言大模型系列、天秤(FlagEval)大模型評(píng)測(cè)體系、「悟道·視界」視覺(jué)大模型系列,以及多模態(tài)大模型系列。
見(jiàn)智研究觀(guān)點(diǎn):
特別值得關(guān)注的是國(guó)產(chǎn)大模型的優(yōu)勢(shì)在于中文語(yǔ)料,并且是安全合規(guī)的數(shù)據(jù)庫(kù)。比如悟道·天鷹就是中英雙語(yǔ)大模型,不只能生成中文,還能讀懂大量的中文世界的原生知識(shí)(放了近40%的中文語(yǔ)料);并且由于規(guī)模小,該模型在消費(fèi)級(jí)顯卡上就支持運(yùn)行,方便C端用戶(hù)訓(xùn)練。
2、比GPT-4算數(shù)能力更強(qiáng)的GOAT大模型
新加坡發(fā)布AI模型,算數(shù)能力強(qiáng)于GPT-4新加坡國(guó)立大學(xué)推出了Goat模型,稱(chēng)該AI模型“專(zhuān)門(mén)用于算術(shù)問(wèn)題”。研究人員表示,"在對(duì)LLaMA模型進(jìn)行微調(diào)后,Goat在算數(shù)上實(shí)現(xiàn)了比GPT-4更高的準(zhǔn)確度與更出色的性能。
見(jiàn)智研究觀(guān)點(diǎn):
專(zhuān)用領(lǐng)域的AI模型將會(huì)此起彼伏的出現(xiàn),在通用模型的基礎(chǔ)上進(jìn)行專(zhuān)用數(shù)據(jù)的投喂和訓(xùn)練,很容易實(shí)現(xiàn)高于通用大模型的專(zhuān)項(xiàng)水平。未來(lái)還會(huì)有更多行業(yè)會(huì)采用這種方式進(jìn)行AI模型訓(xùn)練,包括金融、政府等領(lǐng)域;比如微軟開(kāi)始向美國(guó)政府提供GPT-4和GPT-3兩個(gè)大型語(yǔ)言模型的聊天機(jī)器人技術(shù),未來(lái)可以基于Azure云服務(wù)進(jìn)行專(zhuān)項(xiàng)模型訓(xùn)練。
3、靈活調(diào)用各種API的Gorilla模型
UC伯克利華人博士生做了一個(gè)以大猩猩命名的Gorilla模型,可以靈活調(diào)用各種API,性能超過(guò)GPT-4。API的功能是一種通用語(yǔ)言,使不同的系統(tǒng)之間能夠進(jìn)行有效地溝通,正確使用API可以提高LLM與更廣泛的工具進(jìn)行互動(dòng)的能力。
見(jiàn)智研究觀(guān)點(diǎn):
API調(diào)用一直是LLM大模型最具有挑戰(zhàn)對(duì)的任務(wù)之一,主要是由于無(wú)法生成準(zhǔn)確的輸入?yún)?shù),并且LLM容易對(duì)API調(diào)用的錯(cuò)誤使用產(chǎn)生幻覺(jué)。Gorilla的優(yōu)勢(shì)在于理解和推理約束能力,并且還能夠大大緩解了LLM會(huì)經(jīng)常遇到的幻覺(jué)問(wèn)題,使得檢索反饋結(jié)果的準(zhǔn)確性更高。
4、MetaVL: 將上下文學(xué)習(xí)能力從語(yǔ)言模型遷移到視覺(jué),開(kāi)啟下一個(gè)多模態(tài)時(shí)代
實(shí)驗(yàn)證明,跨模態(tài)的上下文學(xué)習(xí)能力可以轉(zhuǎn)移,該模型顯著提高了視覺(jué)-語(yǔ)言任務(wù)上的上下文學(xué)習(xí)能力,并且在模型大小方面能夠有顯著的優(yōu)化,例如在VQA、OK-VQA和GQA上,所提出方法在參數(shù)數(shù)量減少約20倍的情況下超過(guò)了基準(zhǔn)模型。
見(jiàn)智研究觀(guān)點(diǎn):
上下文學(xué)習(xí)能力從單模態(tài)遷移到多模態(tài)的可能性,證明了在視覺(jué)-語(yǔ)言任務(wù)中通過(guò)遷移可以顯著提升上下文學(xué)習(xí)能力,甚至在模型大小方面實(shí)現(xiàn)優(yōu)化。這意味著多模態(tài)情況下的對(duì)話(huà)能力將得到加強(qiáng),對(duì)于現(xiàn)有的文生圖來(lái)說(shuō)可能會(huì)帶來(lái)新的變化,生成模式對(duì)用戶(hù)將更友好。
5、給GPT寫(xiě)指令的APP
CCF理論計(jì)算機(jī)科學(xué)技術(shù)委員會(huì)委員張長(zhǎng)旺,開(kāi)發(fā)了一個(gè)基于低代碼提示語(yǔ)的快速應(yīng)用開(kāi)發(fā)框架PromptAppGPT,可以實(shí)現(xiàn)基于GPT的自然語(yǔ)言快速應(yīng)用開(kāi)發(fā)。
見(jiàn)智研究觀(guān)點(diǎn):
ChatGPT能夠發(fā)揮多少能力,很大程度上取決于Prompt的質(zhì)量。Prompt是指用戶(hù)在發(fā)起對(duì)話(huà)時(shí)輸入的初始消息,作為與模型進(jìn)行交互的指令方式。所以這是為什么現(xiàn)在都在學(xué)習(xí)Prompt的核心原因。
而PromptAppGPT的推出能夠幫助用戶(hù)大大提高效率,提供多任務(wù)條件觸發(fā)、結(jié)果驗(yàn)證和失敗重試能力,可以讓原本需要多步驟的手動(dòng)生成任務(wù)變成自動(dòng)完成,不需要自己記憶和輸入繁瑣的Prompt咒語(yǔ),只輸入任務(wù)核心必要信息就可以輕松完成任務(wù)。
應(yīng)用
1、Stability AI又放大招,核彈級(jí)更新一鍵擴(kuò)圖
AI修圖繼續(xù)開(kāi)卷,PS平替Uncrop Clipdrop一鍵擴(kuò)圖+重構(gòu)圖片。
Stability AI又又又更新了,它聯(lián)合Clipdrop推出了Uncrop Clipdrop——一個(gè)終極圖像比例編輯器。通過(guò)創(chuàng)建擴(kuò)展背景,這個(gè)工具可以補(bǔ)充任何現(xiàn)有照片或圖像,來(lái)更改任何圖像的比例。
見(jiàn)智研究觀(guān)點(diǎn):
AI作圖圈幾乎每周都會(huì)有重磅更新,之前我們也持續(xù)對(duì)AI作圖產(chǎn)品和工具進(jìn)行更新,上周還有谷歌定制大師StyleDrop又來(lái)炸場(chǎng)。AI作圖可以說(shuō)是AI應(yīng)用內(nèi)卷最嚴(yán)重的賽道了,無(wú)論是巨頭還是小廠(chǎng)都將作圖大戰(zhàn)進(jìn)行到了白熱化的階段。從這個(gè)節(jié)奏來(lái)看,無(wú)疑是對(duì)用戶(hù)端的最大利好,未來(lái)AI高質(zhì)量作圖免費(fèi)也會(huì)成為常態(tài)化趨勢(shì)。
2、強(qiáng)大的3D角色生成引擎重磅來(lái)襲,游戲、影視動(dòng)畫(huà)創(chuàng)作將直接受益
Tafi一家領(lǐng)先的3D數(shù)字內(nèi)容和軟件提供商剛剛宣布推出一款突破性的文本轉(zhuǎn)3D角色引擎,該引擎將改變藝術(shù)家、開(kāi)發(fā)人員和其他專(zhuān)業(yè)人士的創(chuàng)作過(guò)程。僅基于簡(jiǎn)單的文本輸入,即可在幾分鐘內(nèi)輕松生成高質(zhì)量的3D角色。生成數(shù)百億種獨(dú)特的 3D 角色變體。 將角色直接導(dǎo)出到Blender,Unreal或Unity。
見(jiàn)智研究觀(guān)點(diǎn):
該款引擎的推出極大的解決了3D創(chuàng)作中最困難的部分,將使得3D角色創(chuàng)造成本更低。傳統(tǒng)的視覺(jué)訓(xùn)練模型渲染非常耗費(fèi)時(shí)間,而Tafi的這款基于自然語(yǔ)言文本生成自定義 3D 字符的引擎不僅僅使得每一個(gè)3D角色都是獨(dú)一無(wú)二的,更重要的創(chuàng)作時(shí)間縮短到只要幾分鐘。這對(duì)于游戲NPC、影視動(dòng)畫(huà)角色的創(chuàng)建帶來(lái)極大的降本增效。
3、Carbon Health的新AI工具通過(guò)生成記錄和計(jì)費(fèi)代碼來(lái)減少醫(yī)生的工作量
采用GPT來(lái)創(chuàng)建醫(yī)療記錄不僅僅是能夠提高醫(yī)生的工作效率,同時(shí)還能夠有助于提供更加標(biāo)準(zhǔn)化和一致的醫(yī)療記錄,這對(duì)于不同醫(yī)院病歷之間的協(xié)作和信息共享非常重要。
見(jiàn)智研究觀(guān)點(diǎn):AI工具還能夠?yàn)獒t(yī)生提供有關(guān)患者護(hù)理的指南和建議,基于大量的醫(yī)療知識(shí)和數(shù)據(jù)。這有助于醫(yī)生做出更準(zhǔn)確、更綜合的診斷和治療決策,提高患者的治療效果。
但仍需注意的是:盡管AI在醫(yī)療記錄方面具有很多優(yōu)勢(shì),但它并不能完全取代醫(yī)生的專(zhuān)業(yè)判斷和臨床經(jīng)驗(yàn)。
下周關(guān)注
360智腦發(fā)布會(huì)定檔6月13日。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: