日本护士毛茸茸高潮,亚洲精品自偷自拍无码,久久精品国产一区二区三区,日韩人妻无码免费视频一二区

澎湃Logo
下載客戶端

登錄

  • +1

人工智能在IMO上的突破顯示:大力仍可出奇跡

Jonathan Zhou
2024-07-26 13:09
來源:澎湃新聞
? 未來2% >
字號

·通過分析本次國際數(shù)學(xué)奧林匹克競賽(IMO)各題目的解題表現(xiàn),我們可以清晰地看到不同算法如何提升和補充了人工智能模型的能力。

近日,DeepMind的AlphaProof/AlphaGeo在國際數(shù)學(xué)奧林匹克競賽(IMO)中取得了前所未有的成績,解出了六道問題中的四道獲得銀牌。這一成就無疑將與“深藍”擊敗卡斯帕羅夫和“AlphaGo”擊敗李世石一樣,成為人工智能挑戰(zhàn)人類智力巔峰的又一里程碑,同時也將引發(fā)新一輪關(guān)于機器智力邊界的討論。

早期發(fā)現(xiàn)和培養(yǎng)數(shù)學(xué)天才的重要性已經(jīng)被很多人認(rèn)可,他們提出了一個顛覆性的數(shù)學(xué)教育理念——將前沿科學(xué)研究轉(zhuǎn)化為不需要專業(yè)知識背景的抽象基礎(chǔ)數(shù)學(xué)問題,用這些問題在更小年齡段選拔科研人才。在這種思路下,分子結(jié)構(gòu),線性規(guī)劃等復(fù)雜的科學(xué)問題被簡化為如雞兔同籠、牛吃草等基礎(chǔ)數(shù)學(xué)題。與傳統(tǒng)注重知識點的教育模式相比,奧數(shù)更考驗包括歸納和推理能力在內(nèi)的“流動智力”。奧數(shù)解題過程更接近科研工作的本質(zhì)——將具體問題抽象化,或?qū)⒊橄髥栴}具體化,然后在不同抽象層級間穿梭。這種教育理念在選拔數(shù)學(xué)人才方面取得了卓越成功——許多IMO參賽者后來成為杰出數(shù)學(xué)家,其中16名獎牌得主更是獲得了數(shù)學(xué)界最高榮譽菲爾茲獎。

奧數(shù)題目注重通用邏輯能力的特點,使其成為衡量人工智能邏輯能力的理想工具。與大多數(shù)針對特定知識點和基本邏輯判斷的人工智能基準(zhǔn)測試不同,奧數(shù)可以通過多重邏輯推理和難以窮舉的考核方式來評估人工智能的能力。這意味著最有效的解題方法不是簡單的“背題”式預(yù)訓(xùn)練,而是運用通用推理方法——這也是人類在奧數(shù)中取得優(yōu)異成績和進行科研工作所需的核心能力。

AlphaProof/AlphaGeo在國際奧數(shù)比賽中獲得銀牌,僅次于54名金牌選手,標(biāo)志著人工智能系統(tǒng)在通用推理能力上的進步。與“深藍”和“AlphaGo”擊敗人類頂尖選手不同,奧數(shù)涵蓋的領(lǐng)域更加廣泛,對創(chuàng)造性思維和解決前所未見問題的能力要求更高,同時對論證的嚴(yán)謹(jǐn)性要求極為苛刻。這些特點讓我們看到了人工智能在科研工作中取代人類的巨大潛力。

人工智能在國際奧數(shù)比賽上的突破主要源于三大創(chuàng)新:神經(jīng)/符號雙系統(tǒng)架構(gòu),人造數(shù)據(jù)訓(xùn)練方法,探索式舉一反三。

神經(jīng)/符號雙系統(tǒng)架構(gòu)巧妙地結(jié)合了神經(jīng)網(wǎng)絡(luò)和符號系統(tǒng)的優(yōu)勢。神經(jīng)網(wǎng)絡(luò)基于深度學(xué)習(xí)模型,具有強大的歸納能力,可從海量數(shù)據(jù)中發(fā)現(xiàn)隱藏規(guī)律。雖然它可能產(chǎn)生“幻覺”,但這種“創(chuàng)造力”對突破常規(guī)思維很有價值。與之互補的符號系統(tǒng)則擅長嚴(yán)謹(jǐn)?shù)倪壿嬐评恚茉谶壿嬁蚣軆?nèi)做出準(zhǔn)確判斷。DeepMind將這兩個系統(tǒng)融合,創(chuàng)造出一種獨特的問題解決方法。

目前,數(shù)學(xué)界最受關(guān)注的機器命題證明系統(tǒng)是Lean語言,這也是IMO主辦者提供給人工智能的題目格式。首先,它將題目轉(zhuǎn)換為機器可讀的Lean命題,讓符號系統(tǒng)進行邏輯推導(dǎo),得出更多命題。如果這還不足以解決問題,神經(jīng)網(wǎng)絡(luò)就會介入,運用“擴散性思維”(基于蒙特卡洛樹搜索)尋找可能正確的中間命題,搭建已知條件和待證明結(jié)論之間的橋梁。經(jīng)過大量訓(xùn)練,神經(jīng)網(wǎng)絡(luò)在尋找關(guān)鍵推理步驟方面變得越來越高效。

第二個突破是采用“人造數(shù)據(jù)”方法創(chuàng)建訓(xùn)練集。符號引擎生成了數(shù)十億級的奧數(shù)題,這些題目雖然缺乏實際比賽題目的巧妙性,但正確性有保證。通過隱藏中間步驟,這些題目需要神經(jīng)網(wǎng)絡(luò)和符號系統(tǒng)協(xié)作來解決。訓(xùn)練過程重點關(guān)注需要神經(jīng)系統(tǒng)參與的蒙特卡洛樹搜索步驟,提升了模型預(yù)判關(guān)鍵推理環(huán)節(jié)的能力。雖然這些人造題目與實際比賽題目有所不同——后者更注重巧妙和獨特的解法,而非通用方法——但由于數(shù)據(jù)量龐大,許多經(jīng)典證明方法也被隨機生成,在豐富了模型的知識庫的同時也驗證了模型和人類推理的互通之處。

第三個突破是搜索和驗證個例的人工智能模塊。DeepMind與多位數(shù)學(xué)家在《自然》雜志上發(fā)表的研究闡述了深度學(xué)習(xí)模型在前沿數(shù)學(xué)中的潛在應(yīng)用,其中搜索和驗證個例的方法在AlphaProof中得到驗證。數(shù)學(xué)家的工作過程與模型相似,包含“擴散式探索”和嚴(yán)謹(jǐn)論證兩個部分。對于一個命題,數(shù)學(xué)家首先創(chuàng)造個例,然后嚴(yán)格驗證命題在個例中的正確性。如果發(fā)現(xiàn)不正確,他們需要憑直覺改進命題,排除錯誤個例,再繼續(xù)驗證?!皠?chuàng)造個例”和“驗證個例”由符號引擎完成,而改進命題則由擴散式神經(jīng)網(wǎng)絡(luò)負責(zé)。如果引擎能創(chuàng)造足夠多的個例,神經(jīng)網(wǎng)絡(luò)就能從這些數(shù)據(jù)中的規(guī)律判斷出更可能正確的命題。DeepMind介紹了這種擬人工作方式在拓撲學(xué)和抽象代數(shù)上取得的突破,這些成果得益于深度學(xué)習(xí)能夠發(fā)現(xiàn)不明顯的、非線性的、需要大量計算的規(guī)律。

通過分析本次國際數(shù)學(xué)奧林匹克競賽(IMO)各題目的解題表現(xiàn),我們可以清晰地看到不同算法如何提升和補充了人工智能模型的能力。

Q4作為一道典型的幾何題,展示了DeepMind今年早些時候發(fā)布的AlphaGeo算法的能力。與更為通用的AlphaProof不同,AlphaGeo專注于通過幾何題引擎和輔助線解決幾何問題。它通過建立一個包含一億條復(fù)雜命題證明的龐大數(shù)據(jù)庫,培養(yǎng)了神經(jīng)網(wǎng)絡(luò)判斷輔助線效用的能力。這個理解輔助線功效的神經(jīng)網(wǎng)絡(luò)能夠從數(shù)十條可行的輔助線中篩選出最具潛力的方向。這種高效篩選使AlphaGeo能在搜索樹上深入探索,從而解決更具挑戰(zhàn)性的問題。由于幾何題的搜索空間最小,AlphaGeo在拿到題后19秒就證明出來了,遠快于任何人類。(圖為AlphaGeo的解法和輔助線)

Q2則考驗了“中間命題”的廣度。與幾何題不同,數(shù)論問題的中間步驟搜索空間更為廣闊。在Q2中,如果參賽者(無論是人類還是AI)能洞察到x=ab+1這個巧妙的中間步驟,整個問題就會簡化為僅需三行即可證明的簡單命題。這意味著,AlphaProof與人類一樣,需要具備發(fā)現(xiàn)x=ab+1的洞察力??紤]到這個構(gòu)造在已知題庫中前所未見,對它的洞察力必然源于AlphaProof在生成數(shù)十億訓(xùn)練樣本的過程中,反復(fù)嘗試類似問題后產(chǎn)生的涌現(xiàn)能力。

Q1和Q6則考驗了AI反復(fù)創(chuàng)造和驗證個例的能力。具備這種能力的AI可以基于已知命題生成大量個例,通過驗證這些個例是否符合證明條件,不斷探索正例和反例的邊界,最終找到正確的命題。這種主動探索能力的出現(xiàn),預(yù)示著AI有能力在尋找未知解時探索新穎路徑,并在過程中不斷調(diào)整方向。最令人驚嘆的是,在這次比賽中,只有五名人類選手解出的Q6,AlphaProof卻給出了滿分證明。這有力地證明了AI在某些方面已經(jīng)超越了人類的通用推理能力。

然而,AI未能解出的Q3和Q5,都屬于奧數(shù)中的“排列組合”問題。這類問題的特點是解空間極其發(fā)散,且命題相對更加開放。這導(dǎo)致AlphaProof在構(gòu)建人造題庫時難以進行更深入的搜索,從而限制了它在這類問題上的解題能力上限。這不僅展示了AI在數(shù)學(xué)推理方面的巨大進步,也揭示了它在解空間更廣的領(lǐng)域存在的局限性,為未來AI算法的改進指明了方向。

 

人工智能在IMO的成就,為我們展示了人工智能如何助力前沿數(shù)學(xué)研究。雖然這類模型從狹義上看并非“通用人工智能”——其訓(xùn)練集和用途局限于解決不等式、平面幾何、數(shù)論等特定題目,但其開發(fā)方法為人工智能在高級智力勞動中的應(yīng)用提供了寶貴啟示。IMO模型的成功也指明了未來科研工作者與深度學(xué)習(xí)模型可以如何合作。

首先,數(shù)學(xué)家必須將前沿理論轉(zhuǎn)化為計算機可讀形式。近年來,包括陶哲軒在內(nèi)的多位數(shù)學(xué)家呼吁用開源推理語言Lean表達數(shù)學(xué)成果(這也是AlphaProof模型答題的形式)。目前,這個生態(tài)系統(tǒng)已包含超過15萬項定理,為未來基于深度學(xué)習(xí)的數(shù)學(xué)研究奠定了基礎(chǔ)。這個工作不止需要數(shù)學(xué)界把已經(jīng)發(fā)表的論文和證明轉(zhuǎn)化成機器可讀/可驗證模式,它還可能改變數(shù)學(xué)家的工作流程。假如確信某些相對繁瑣的需要列舉不同情況證明步驟可以用人工智能證明,數(shù)學(xué)家會更多選擇“大力出奇跡”的證明方式。曾經(jīng),有一萬種分類的證明方法是不會被數(shù)學(xué)家嘗試/接受的,因為審稿者也無法確認(rèn)其正確性,但現(xiàn)在可以由人工智能完成。此外,眾多數(shù)學(xué)家指出,在形式化證明助手Lean中,“簡單命題”和“繁瑣命題”的概念與人類直覺存在顯著差異。隨著Lean逐漸發(fā)展成為一種普遍應(yīng)用的工具,人類數(shù)學(xué)家將擔(dān)當(dāng)起“向?qū)А钡年P(guān)鍵職能,其核心任務(wù)是將數(shù)學(xué)問題的研究路徑轉(zhuǎn)化為Lean更易理解和處理的形式。

其次,存量數(shù)據(jù)和創(chuàng)造人工數(shù)據(jù)的方法將變得至關(guān)重要。2018年,DeepMind在預(yù)測蛋白質(zhì)結(jié)構(gòu)方面取得了超越人類的突破,這得益于全球生物實驗室積累的大量蛋白質(zhì)折疊數(shù)據(jù)。然而,真實世界的科研數(shù)據(jù)往往稀缺。高質(zhì)量數(shù)據(jù)集,尤其是具有創(chuàng)新性的數(shù)據(jù)集,數(shù)量有限且難以獲取。合成數(shù)據(jù)可以彌補這一缺口。精心設(shè)計的合成數(shù)據(jù)生成算法可以創(chuàng)造出包含各種抽象模式和推理路徑的數(shù)據(jù),幫助它訓(xùn)練出的深度學(xué)習(xí)模型培養(yǎng)更深層次的數(shù)學(xué)直覺和創(chuàng)造力。這個過程和AlphaProof/AlphaGeo研發(fā)一樣,需要有對領(lǐng)域理解極深的人類做準(zhǔn)備工作,并在模型能力和可擴展性上找到平衡點。由于深度學(xué)習(xí)中的規(guī)模法則目前尚未遇到瓶頸,我們有理由相信,合成無限量的訓(xùn)練和測試樣本可以進一步提升深度學(xué)習(xí)模型的抽象能力,提高擴展性,甚至催生出更具創(chuàng)新性的思辨能力。

AlphaProof/AlphaGeo的突破是算力增大過程中產(chǎn)生“涌現(xiàn)能力”的有力證據(jù)。DeepMind在訓(xùn)練模型時使用了驚人的三百億PetaFLOPS算力,相當(dāng)于訓(xùn)練了GPT-4級別的大語言模型。近期,大語言模型的應(yīng)用似乎進入了瓶頸期,市場上出現(xiàn)了認(rèn)為“算力缺口”并不存在的觀點,認(rèn)為現(xiàn)有算力已足以支持大語言模型的市場需求。然而,DeepMind在IMO上的成果有力地反駁了這種觀點——即使通用大語言模型的算力需求進入瓶頸,同等規(guī)模的算力仍然可以在科研前沿等高價值領(lǐng)域做出大量超越人類巔峰的工作。更重要的是,我們尚不清楚更高數(shù)量級的算力是否能在理論物理、能源和材料科學(xué)等更多人類智力巔峰領(lǐng)域取得超越人類的成果。另外,假如更高數(shù)量級的算力可以在深度學(xué)習(xí)領(lǐng)域有和人類一樣的創(chuàng)新能力,那未來最好的科研模型可能完成自我迭代,指數(shù)式地超越人類智能極限。

人工智能超越人類智能的征程,或許才剛剛開始。

(作者系加拿大國際數(shù)學(xué)奧林匹克競賽集訓(xùn)隊員,普特南競賽全球百強選手。2014年畢業(yè)于哈佛大學(xué)應(yīng)用數(shù)學(xué)系,現(xiàn)致力于人工智能在金融領(lǐng)域?qū)嵺`。聯(lián)系方式:nirvanatear@hotmail.com。)

    責(zé)任編輯:宦艷紅
    圖片編輯:金潔
    校對:張艷
    澎湃新聞報料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋
            黄色在线免费观看| 色哟永久免费| av毛片无码不卡| 婷婷亚洲久悠悠色悠在线播放| 久久久久久久久8久久久 | 亚洲av成人一区二区三区观看| 国产乱交在线播放| 欧美精品亚洲精品日韩专| 乱中年女人伦av| 60岁老女人毛茸茸| 丁香六月国产| 天堂acv在线免费| 丁香五月六月天| 免费高清aav| 国产freesexvideos中国麻豆| 特级AV永久免费| 日本免费一区二区三区在线播放| 欧美成人性生活免费片| 狠狠操人人操| 国语自产精品视频在线第100页| 国产 精品 无码澳门| 国产老肥熟xxxx| 兰州熟女专区| 色一乱一伦一图一区二区精品| 日本成人午夜在线观看| 亚洲成av人综合在线观看| 精品三级在线| 8×8X拔擦拔擦在线视频网站| 69嫩草熟女1P| 亚洲精品第一区二区在线| 免费看8MAv片成人| 免看一级a一片高潮喷水| 三级人一区二区区网| 久热这里只有精品蜜臀av| 九九久久精品免费观看| 欧美人与动xxxxz0oz小说| 护士被强女千到高潮视频| 亚洲成a人片在线观看www| 亚洲最大av网站在线观看| 亚洲一区波多野结衣在线app| 国产精品人一区二区三区|