- +1
不到一年,非營(yíng)利AI安全研究公司又獲5.8億美元B輪融資
當(dāng)下,AI大模型正成為一些行業(yè)驅(qū)動(dòng)的底層架構(gòu),同時(shí)表現(xiàn)出的一般規(guī)則是“系統(tǒng)越強(qiáng)大,就越難解釋其行為”。
像OpenAI的GPT-3通用語言模型幾乎可以以任何風(fēng)格和任何主題生成非常自然的文本。但在它寫詩時(shí),它是如何做到的?它在“想”什么?什么樣的調(diào)整讓它更憂郁更浪漫,或者以特定的方式限制它的措辭和詞匯?我們幾乎一無所知。
“當(dāng)今的大型通用系統(tǒng)可以帶來顯著的好處,但也可能無法預(yù)測(cè)、不可靠和不透明:我們的目標(biāo)是在這些問題上取得進(jìn)展?!鼻癘penAI研究副總裁Dario Amodei此前寫道,“Anthropic的目標(biāo)是推進(jìn)基礎(chǔ)研究,讓我們能夠構(gòu)建更強(qiáng)大、更通用、更可靠的人工智能系統(tǒng),然后以造福人類的方式部署這些系統(tǒng),”
當(dāng)?shù)貢r(shí)間4月29日,AI研究機(jī)構(gòu)Anthropic宣布完成5.8億美元B輪融資,由加密貨幣交易所FTX首席執(zhí)行官Sam Bankman-Fried領(lǐng)投。
Anthropic在創(chuàng)立時(shí)并未有明確的盈利目標(biāo),所以在其A輪融資1.24億美元時(shí)就廣被討論,被科技媒體TechCrunch稱“有1.24億美元可以燒”。在此輪融資,Anthropic稱將利用這筆融資建立大規(guī)模的實(shí)驗(yàn)基礎(chǔ)設(shè)施,以探索和改進(jìn)計(jì)算密集型AI模型的安全性和可靠性。
“通過這次籌款,我們將探索機(jī)器學(xué)習(xí)系統(tǒng)的可預(yù)測(cè)擴(kuò)展特性,同時(shí)仔細(xì)研究大規(guī)模出現(xiàn)功能和安全問題的不可預(yù)測(cè)的方式,”Amodei在公告中說。
據(jù)Anthropic的公告:本研究的目的是開發(fā)構(gòu)建大型模型所需的技術(shù)組件,這些模型具有更好的隱性保護(hù)措施并且需要較少的訓(xùn)練后干預(yù),以及開發(fā)必要的工具來進(jìn)一步研究這些模型以確信保障措施確實(shí)有效。該公司還在建立團(tuán)隊(duì)和合作伙伴關(guān)系,致力于探索這些模式的政策和社會(huì)影響。
如果我們不了解AI系統(tǒng)的工作原理,那么就只能在它出現(xiàn)問題時(shí)做出反應(yīng)。例如,在AI人臉識(shí)別時(shí)表現(xiàn)出偏見,或者在AI被問及CEO時(shí)傾向于描述男性。目前這樣的行為已融入模型,解決方案是過濾其輸出,而不是首先防止它具有那些不正確的“概念”。
目前,Anthropic已取得一些進(jìn)展。在可解釋性方面,它在對(duì)小型語言模型的數(shù)學(xué)逆向工程方面取得了進(jìn)展,并開始了解大語言模型中模式匹配行為的來源?!八麄?cè)诤?jiǎn)化版模型中發(fā)現(xiàn)的東西可以遷移到更大的模型中”,Conjecture公司和研究小組Connor Leahy表示。
在可操縱性和魯棒性方面,它開發(fā)了基線技術(shù)(baseline techniques),使大型語言模型更加“有用和無害”,隨后通過強(qiáng)化學(xué)習(xí)進(jìn)一步改善這些屬性,并發(fā)布了一個(gè)數(shù)據(jù)集來幫助其他研究實(shí)驗(yàn)室訓(xùn)練更符合人類偏好的模型。它還發(fā)布了對(duì)大型語言模型性能的突然變化以及這種現(xiàn)象的社會(huì)影響的分析,這表明需要大規(guī)模研究安全問題。
“我們?cè)诶斫夂涂刂迫斯ぶ悄芟到y(tǒng)的行為方面取得了初步進(jìn)展,并且正在逐步組裝所需的部件,以制造有益于社會(huì)的可用、集成的人工智能系統(tǒng)?!盇modei表示。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




