不到一年，非營(yíng)利AI安全研究公司又獲5.8億美元B輪融資

澎湃新聞?dòng)浾?邵文

2022-04-30 19:28

來源：澎湃新聞

當(dāng)下，AI大模型正成為一些行業(yè)驅(qū)動(dòng)的底層架構(gòu)，同時(shí)表現(xiàn)出的一般規(guī)則是“系統(tǒng)越強(qiáng)大，就越難解釋其行為”。

像OpenAI的GPT-3通用語言模型幾乎可以以任何風(fēng)格和任何主題生成非常自然的文本。但在它寫詩時(shí)，它是如何做到的？它在“想”什么？什么樣的調(diào)整讓它更憂郁更浪漫，或者以特定的方式限制它的措辭和詞匯？我們幾乎一無所知。

“當(dāng)今的大型通用系統(tǒng)可以帶來顯著的好處，但也可能無法預(yù)測(cè)、不可靠和不透明：我們的目標(biāo)是在這些問題上取得進(jìn)展?！鼻癘penAI研究副總裁Dario Amodei此前寫道，“Anthropic的目標(biāo)是推進(jìn)基礎(chǔ)研究，讓我們能夠構(gòu)建更強(qiáng)大、更通用、更可靠的人工智能系統(tǒng)，然后以造福人類的方式部署這些系統(tǒng)，”

當(dāng)?shù)貢r(shí)間4月29日，AI研究機(jī)構(gòu)Anthropic宣布完成5.8億美元B輪融資，由加密貨幣交易所FTX首席執(zhí)行官Sam Bankman-Fried領(lǐng)投。

Anthropic在創(chuàng)立時(shí)并未有明確的盈利目標(biāo)，所以在其A輪融資1.24億美元時(shí)就廣被討論，被科技媒體TechCrunch稱“有1.24億美元可以燒”。在此輪融資，Anthropic稱將利用這筆融資建立大規(guī)模的實(shí)驗(yàn)基礎(chǔ)設(shè)施，以探索和改進(jìn)計(jì)算密集型AI模型的安全性和可靠性。

“通過這次籌款，我們將探索機(jī)器學(xué)習(xí)系統(tǒng)的可預(yù)測(cè)擴(kuò)展特性，同時(shí)仔細(xì)研究大規(guī)模出現(xiàn)功能和安全問題的不可預(yù)測(cè)的方式，”Amodei在公告中說。

據(jù)Anthropic的公告：本研究的目的是開發(fā)構(gòu)建大型模型所需的技術(shù)組件，這些模型具有更好的隱性保護(hù)措施并且需要較少的訓(xùn)練后干預(yù)，以及開發(fā)必要的工具來進(jìn)一步研究這些模型以確信保障措施確實(shí)有效。該公司還在建立團(tuán)隊(duì)和合作伙伴關(guān)系，致力于探索這些模式的政策和社會(huì)影響。

如果我們不了解AI系統(tǒng)的工作原理，那么就只能在它出現(xiàn)問題時(shí)做出反應(yīng)。例如，在AI人臉識(shí)別時(shí)表現(xiàn)出偏見，或者在AI被問及CEO時(shí)傾向于描述男性。目前這樣的行為已融入模型，解決方案是過濾其輸出，而不是首先防止它具有那些不正確的“概念”。

目前，Anthropic已取得一些進(jìn)展。在可解釋性方面，它在對(duì)小型語言模型的數(shù)學(xué)逆向工程方面取得了進(jìn)展，并開始了解大語言模型中模式匹配行為的來源?！八麄?cè)诤?jiǎn)化版模型中發(fā)現(xiàn)的東西可以遷移到更大的模型中”，Conjecture公司和研究小組Connor Leahy表示。

在可操縱性和魯棒性方面，它開發(fā)了基線技術(shù)（baseline techniques），使大型語言模型更加“有用和無害”，隨后通過強(qiáng)化學(xué)習(xí)進(jìn)一步改善這些屬性，并發(fā)布了一個(gè)數(shù)據(jù)集來幫助其他研究實(shí)驗(yàn)室訓(xùn)練更符合人類偏好的模型。它還發(fā)布了對(duì)大型語言模型性能的突然變化以及這種現(xiàn)象的社會(huì)影響的分析，這表明需要大規(guī)模研究安全問題。

“我們?cè)诶斫夂涂刂迫斯ぶ悄芟到y(tǒng)的行為方面取得了初步進(jìn)展，并且正在逐步組裝所需的部件，以制造有益于社會(huì)的可用、集成的人工智能系統(tǒng)?！盇modei表示。

責(zé)任編輯：李躍群

澎湃新聞報(bào)料：021-962866

澎湃新聞，未經(jīng)授權(quán)不得轉(zhuǎn)載

我要舉報(bào)

#AI安全研究公司 #OpenAI #GPT-3