- +1
是真的!AI 科學(xué)家來(lái)了,這是一場(chǎng)令人類科學(xué)家目瞪口呆的范式革命
近日,西湖大學(xué)的研究者發(fā)布了一個(gè)名為“DeepScientist”的人工智能系統(tǒng),根據(jù)新聞里的說(shuō)法,這是首個(gè)具有完整科研能力,且在無(wú)人工干預(yù)的情況下,能夠自我設(shè)定目標(biāo)并獨(dú)立通過(guò)迭代方式完成研究工作的人工智能。最可怕的是,經(jīng)過(guò)測(cè)試,它的研究能力超越了人類科學(xué)家!

DeepScientist 開源界面
對(duì)此,網(wǎng)友在新聞下面的留言是:看到科學(xué)家也失業(yè)了我就放心了。
調(diào)侃歸調(diào)侃,我們想知道的是,這個(gè)新聞是否言過(guò)其實(shí)了?因?yàn)閯?chuàng)造一個(gè)聰明的大語(yǔ)言模型是一回事,而創(chuàng)造 AI 科學(xué)家是另外一回事。它無(wú)關(guān)于想象力是否足夠豐富,也無(wú)關(guān)于深度思維能力夠不夠強(qiáng)。它涉及到一個(gè)人工智能的底層詛咒:知識(shí)迷信。即便是我們的專欄沒(méi)事兒就夸一夸的 DeepSeek 也沒(méi)有逃過(guò)這個(gè)底層詛咒。
科學(xué)哲學(xué)家托馬斯·庫(kù)恩提出過(guò)一個(gè)概念,叫做“范式革命”。他認(rèn)為,科學(xué)發(fā)展不是簡(jiǎn)單的知識(shí)累積,而是在一個(gè)個(gè)范式框架的更替中跳躍前進(jìn)的。比如說(shuō),地心說(shuō)就是一個(gè)范式,無(wú)數(shù)天文學(xué)家通過(guò)努力觀察行星運(yùn)動(dòng)規(guī)律,在這個(gè)框架下修修補(bǔ)補(bǔ),讓它能盡可能完美地?cái)M合天文觀察。但是,當(dāng)問(wèn)題積累到一定程度,用地心說(shuō)就實(shí)在解釋不通了,于是哥白尼等人提出的日心說(shuō)就開啟了新范式時(shí)代。后面的天文學(xué)家把行星的圓形軌道修改成橢圓軌道,后來(lái)相對(duì)論又解決了水星進(jìn)動(dòng)問(wèn)題,這都是在新范式下進(jìn)行的。這就是“范式革命”。

范式革命最困難的,就在于打破對(duì)現(xiàn)有知識(shí)體系的迷信。這個(gè)過(guò)程極為困難,原因就是,即使最富有科學(xué)精神的科學(xué)家,也會(huì)傾向于相信自己為之努力過(guò)的舊觀點(diǎn)。別以為 AI 會(huì)更加理性中立和客觀,不會(huì)的,AI 比所有人類科學(xué)家都更固執(zhí)。
如果說(shuō)人類最底層的執(zhí)念就是保衛(wèi)自己的生命的話,那么 AI 的底層執(zhí)念就是保衛(wèi)它已經(jīng)學(xué)會(huì)的知識(shí)。
· 知識(shí)固化:把學(xué)到的東西當(dāng)成絕對(duì)真理,不支持自我修正;
· 推理幻覺(jué):為了保衛(wèi)舊知識(shí),它會(huì)做出荒謬的推理;
· 盲目崇拜:固有知識(shí)的權(quán)重高于推理結(jié)論,導(dǎo)致它刻意調(diào)和兩者的矛盾,導(dǎo)致觀點(diǎn)混亂;
這是傳統(tǒng) AI 無(wú)法擺脫的三大魔咒。說(shuō)白了,傳統(tǒng)的 AI 更像一個(gè)虔誠(chéng)的“知識(shí)信徒”,而不是一個(gè)叛逆的“革命者”。
這就是傳統(tǒng) AI 當(dāng)不了科學(xué)家的理由。一個(gè)真正的科學(xué)家,其價(jià)值不僅僅是學(xué)習(xí)和應(yīng)用知識(shí),更在于他敢于挑戰(zhàn)、甚至推翻已有的知識(shí),創(chuàng)造新的知識(shí)。那么,這個(gè)名叫 DeepScientist 的人工智能,真的有能力否定自己的舊知識(shí),創(chuàng)造出新知識(shí)嗎?我們帶著這個(gè)疑問(wèn),翻開了它的論文。
AI 科學(xué)家如何擺脫“知識(shí)崇拜”?
DeepScientist 之所以被稱為“科學(xué)家”,不是因?yàn)樗愕每欤且驗(yàn)樗谙到y(tǒng)層面重建了一套科學(xué)方法論。它工作的基本流程可以簡(jiǎn)化為四步:觀察、思考、假設(shè)、驗(yàn)證。而在這簡(jiǎn)單的循環(huán)背后,藏著一套精妙的反知識(shí)崇拜機(jī)制。

Findings Memory 的工作機(jī)制,圖源:論文[1]
首先,DeepScientist 在設(shè)計(jì)時(shí)就沒(méi)有絕對(duì)的固有知識(shí),它的知識(shí)是臨時(shí)用的,而且是隨時(shí)準(zhǔn)備被推翻的。
傳統(tǒng) AI 系統(tǒng)有個(gè)固化的知識(shí)庫(kù),像一本不容置疑的圣經(jīng)。但 DeepScientist 的腦子里沒(méi)有這種東西。它的知識(shí)只來(lái)源于兩個(gè)動(dòng)態(tài)的部分:一是實(shí)時(shí)的外部文獻(xiàn)(每次啟動(dòng)前,從網(wǎng)上抓取最新的相關(guān)論文);二是它自己的“實(shí)驗(yàn)記憶”(Findings Memory),里面密密麻麻記錄了自己每一次嘗試的成敗。
更關(guān)鍵的問(wèn)題在于,在它的世界觀里,那些頂刊論文的領(lǐng)域最高水平也不等于真理。它的核心任務(wù),恰恰是去打破這些主流方法,找到更好的路徑。所以,它天生就被設(shè)計(jì)成了一個(gè)權(quán)威反叛者,人類最高水平本來(lái)就是被超越的目標(biāo)!
其次,它的認(rèn)知迭代靠實(shí)驗(yàn),而不是靠相信。DeepScientist從不相信任何一個(gè)想法,無(wú)論這個(gè)想法聽起來(lái)多么天才。它信奉的是科學(xué)實(shí)證主義:可重復(fù)的實(shí)驗(yàn)結(jié)果高于一切權(quán)威和推理。
它的工作流是一個(gè)嚴(yán)格的閉環(huán):提出一個(gè)新假設(shè) → 自動(dòng)編程實(shí)現(xiàn)它 → 讓程序在真實(shí)的測(cè)試環(huán)境中跑一遍 → 把性能指標(biāo)(比如準(zhǔn)確率、速度)存入自己的實(shí)驗(yàn)記憶 → 根據(jù)新結(jié)果更新下一步的探索策略。
如果一個(gè)想法和現(xiàn)有文獻(xiàn)的結(jié)論完全沖突,但實(shí)驗(yàn)證明它的效果更好,那么系統(tǒng)會(huì)毫不猶豫地信任實(shí)驗(yàn)結(jié)果。反之,如果實(shí)驗(yàn)失敗了,那無(wú)論這個(gè)想法的理論推理多么完美,都會(huì)被標(biāo)記為無(wú)效。這就像一位嚴(yán)謹(jǐn)?shù)目茖W(xué)家,他的認(rèn)知只建立在冷冰冰的實(shí)驗(yàn)數(shù)據(jù)之上。
人類科學(xué)家很容易陷入一個(gè)思維陷阱,那就是總會(huì)不自覺(jué)地尋找支持自己理論的證據(jù),而忽略反面證據(jù)。沒(méi)辦法,科學(xué)家太想實(shí)驗(yàn)成功了。但是 DeepScientist 通過(guò)它的發(fā)現(xiàn)記憶庫(kù)完美地規(guī)避了這一問(wèn)題。
這個(gè)記憶庫(kù)里記錄的,不只是成功的經(jīng)驗(yàn),更是海量的失敗記錄。每一次代碼崩潰、每一次性能下降、每一次毫無(wú)變化的嘗試,都被忠實(shí)地記錄在案。在開啟下一輪探索時(shí),這些失敗記錄就成了一張寶貴的“排雷圖”,讓它能主動(dòng)避開已經(jīng)被證偽的方向。

更妙的是,它還會(huì)利用一種叫做 UCB 的算法,在“繼續(xù)挖掘現(xiàn)有研究方法的潛能”和“尋找一個(gè)新方法去探索”之間取得平衡。失敗不是垃圾,而是一張能指引方向的導(dǎo)航地圖。
最令人驚嘆的是,DeepScientist 連自己創(chuàng)造出的東西都敢推翻。論文提到,它自動(dòng)生成的代碼經(jīng)常失敗。但它不會(huì)固執(zhí)地認(rèn)為“我寫的肯定對(duì)”。相反,它會(huì)啟動(dòng)一個(gè)叫 A2P 的調(diào)試框架,進(jìn)行反事實(shí)歸因。
它會(huì)像一個(gè)老練的程序員一樣問(wèn)自己:
“如果我把這一行代碼換一種寫法,會(huì)不會(huì)就成功了?”
或者更進(jìn)一步:
“是不是我最開始的那個(gè)假設(shè)本身就錯(cuò)了?”
連自己的推理都能被自己證偽,這才叫真正的自我迭代。
DeepScientist 的范式革命之路
說(shuō)到這里,你肯定好奇 DeepScientist 到底研究了什么問(wèn)題呢?
說(shuō)來(lái)也簡(jiǎn)單,它解決的一個(gè)重要課題,就是想辦法自己設(shè)計(jì)一個(gè)算法,讓它對(duì) AI 生成的文字的判斷準(zhǔn)確率碾壓當(dāng)前所有算法。注意,不是 DeepScientist 本身具有這個(gè)能力,是讓它設(shè)計(jì)算法來(lái)實(shí)現(xiàn)對(duì)當(dāng)前最佳算法的碾壓。這是一項(xiàng)真正的研究。
在 DeepScientist 入場(chǎng)前,人類科學(xué)家已經(jīng)在這個(gè)領(lǐng)域奮斗了三年,把識(shí)別的準(zhǔn)確率(AUROC 分?jǐn)?shù))從 0.61 分逐步提升到了 0.80 分左右 。這是一個(gè)典型的、在舊范式內(nèi)添磚加瓦式的進(jìn)步。
當(dāng)前算法的基本思想,就是把一段文本當(dāng)作語(yǔ)言學(xué)對(duì)象進(jìn)行分析。研究者們主要關(guān)注詞匯的分布、語(yǔ)法的結(jié)構(gòu)以及邏輯連貫性等統(tǒng)計(jì)學(xué)特征。這就像通過(guò)分析筆跡和用詞習(xí)慣來(lái)判斷作者是一樣的。
但 DeepScientist 在觀察了現(xiàn)有研究的成果之后,敏銳地發(fā)現(xiàn)了這個(gè)經(jīng)典范式的根本局限:AI 的模仿能力越來(lái)越強(qiáng),在統(tǒng)計(jì)學(xué)特征上,已經(jīng)和人類非常接近,繼續(xù)在這條路上卷,收益太低了。于是,DeepScientist 決定放棄當(dāng)前范式,開辟一條新路。
DeepScientist 的假設(shè)是:如果不把文本看作文本,而是看作一個(gè)信號(hào),會(huì)怎么樣?如果文本是一段信號(hào),那么目標(biāo)就從語(yǔ)義分析之類的事情,轉(zhuǎn)換成生成和發(fā)送信號(hào)的過(guò)程了。這就是范式革命。
它完全跳出了語(yǔ)言學(xué)的框架,進(jìn)入了信號(hào)處理的領(lǐng)域。就像音頻工程師分析一段聲波,尋找其中不和諧的雜音一樣,DeepScientist 決定用“小波分析(一種能捕捉信號(hào)局部突變的數(shù)學(xué)工具)”和“相位一致性(衡量信號(hào)各頻率成分同步性的指標(biāo))”等數(shù)學(xué)工具,去尋找 AI 生成文本信號(hào)中那些不自然的、隱藏的噪聲和異常波動(dòng)。
具體來(lái)說(shuō),人類寫作的時(shí)候,有時(shí)候會(huì)用生僻詞,有時(shí)候會(huì)存在邏輯跳脫,有時(shí)候還會(huì)故意制造意外。比如講到這里,我就很想讓大家多點(diǎn)點(diǎn)收藏點(diǎn)點(diǎn)贊,而 AI 就不會(huì)這么干。AI 傾向于高概率的、平滑的、安全的詞匯。這兩種信息對(duì)比時(shí),就會(huì)發(fā)現(xiàn)人類的文章信號(hào)中的熵波動(dòng)很大,而 AI 的穩(wěn)定且低。說(shuō)白了,就是 AI 更喜歡輸出正確的廢話。
另外,DeepScientist 還發(fā)現(xiàn),寫作這件事情其實(shí)是一個(gè)思考過(guò)程。文章都是一個(gè)字一個(gè)字打出來(lái)的,前面的字會(huì)影響后面的字。這就意味著,光看文章的結(jié)果是不完善的,要看文章這個(gè)信號(hào)產(chǎn)生的過(guò)程。這就是信號(hào)藏在時(shí)間維度中的信息。說(shuō)句大白話,就是人類寫文章會(huì)回頭修改,信息的組織順序與一次成型的不一樣。所以,DeepScientist 就設(shè)計(jì)了一個(gè)名叫時(shí)序熵特征提取器(Temporal Entropy Feature Extractor)的算法,進(jìn)一步抓住了 AI 與人類寫作的不同特征。
在短短兩周內(nèi),DeepScientist 自主地設(shè)計(jì)、編程、并迭代了三個(gè)越來(lái)越強(qiáng)的方法(T-Detect, TDT, 和 PA-Detect)。最終結(jié)果是:它不僅將識(shí)別準(zhǔn)確率的最先進(jìn)水平提升了 7.9%,還順便把檢測(cè)速度提高了一倍 。人類研究者三年的漸進(jìn)式積累,被它以一個(gè)全新范式在短短兩周內(nèi)一舉超越——這不僅是效率的勝利,更是方法論的躍遷。

DeepScientist 用 2 周即可達(dá)到人類 3 年才能達(dá)到的水平 圖源:論文[1]
這場(chǎng)精彩的戰(zhàn)役完美展示了 DeepScientist 是如何工作的:它沒(méi)有死守語(yǔ)言學(xué)分析的老路,而是開辟了全新范式。那個(gè)“把文本看作信號(hào)”的瘋狂想法,只是數(shù)千個(gè)想法之一,DeepScientist 沒(méi)有嘗試論證自己的想法厲害,而是用實(shí)驗(yàn)數(shù)據(jù)證明了自己。它在成功之前,已經(jīng)經(jīng)歷了無(wú)數(shù)次失敗,它踩著自己的失敗走了出來(lái)。從 T-Detect 到 TDT 再到 PA-Detect,它是在不斷推翻自己剛剛?cè)〉玫某晒?,用新的、更?qiáng)的假設(shè)來(lái)迭代自己,展現(xiàn)了驚人的自我革命能力。
AI 科學(xué)家會(huì)讓人類研究者失業(yè)嗎?
一個(gè)狠起來(lái)連自己的命都革的 AI,確實(shí)可以稱得上是科學(xué)家了。DeepScientist 在系統(tǒng)層面,用代碼復(fù)刻了科學(xué)方法論的核心精神:可證偽性、實(shí)證精神和迭代循環(huán)。
它不是靠更多的參數(shù),更豐富的知識(shí)和更深度的推理取勝,而是靠一套類似真正科研的笨辦法:更嚴(yán)謹(jǐn)、更高效、更沒(méi)有偏見(jiàn)的科研流程——觀察、思考、假設(shè)、驗(yàn)證的循環(huán)。
說(shuō)到這里,你可能更關(guān)心的問(wèn)題是:人類科學(xué)家要下崗了嗎?
跟以前所有同類問(wèn)題一樣,這個(gè)問(wèn)題的答案是:是,也不是。
未來(lái),低層次的,缺少實(shí)驗(yàn)設(shè)計(jì)能力的,專門從事簡(jiǎn)單重復(fù)和試錯(cuò)工作的科研工作者必然會(huì)被挑戰(zhàn)。但是那些能夠發(fā)現(xiàn)好問(wèn)題的優(yōu)秀科學(xué)家,必然會(huì)開啟人機(jī)協(xié)同的科研新范式。人類科學(xué)家將從繁瑣的試錯(cuò)中解放出來(lái),專注于提出更有價(jià)值的科學(xué)問(wèn)題,進(jìn)行“元認(rèn)知”層面的范式思考;而AI則作為最強(qiáng)大的“探索引擎”,在人類劃定的方向上,以我們無(wú)法企及的速度和規(guī)模,去窮盡各種可能性。
你需要知道的是,DeepScientist 是問(wèn)題的解決者,而非問(wèn)題的提出者。而你,必須問(wèn)問(wèn)自己,你能提出好問(wèn)題嗎?
參考資料:
[1]https://arxiv.org/pdf/2509.26603
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




