- +1
xAI發(fā)布Grok 3模型,全球最大十萬(wàn)卡集群再現(xiàn)“力大磚飛”

大模型之家訊 北京時(shí)間 2 月 13 日中午 12 點(diǎn)(太平洋時(shí)間 2 月 12 日晚上 8 點(diǎn)),馬斯克旗下的人工智能公司xAI正式發(fā)布了最新一代大模型——Grok 3,并進(jìn)行了現(xiàn)場(chǎng)演示。馬斯克曾稱GroK 3為“地球上最聰明的人工智能”,而此次發(fā)布會(huì)展示了其在推理能力、代碼生成以及多項(xiàng)基準(zhǔn)測(cè)試中的卓越表現(xiàn)。這次發(fā)布會(huì)不僅吸引了大量的關(guān)注,直播觀看人數(shù)迅速突破百萬(wàn),反映出市場(chǎng)對(duì)Grok 3的巨大期待。


Grok 3 在多個(gè)關(guān)鍵測(cè)試中展現(xiàn)出顯著優(yōu)勢(shì):
AIME'24 數(shù)學(xué)能力測(cè)試:Grok 3 取得 52 分,遠(yuǎn)超 DeepSeek-V3 的 39 分。
GPQA 科學(xué)知識(shí)評(píng)估:Grok 3 以 75 分 領(lǐng)先 DeepSeek-V3 的 65 分。
LCB Oct-Feb 編程能力測(cè)試:Grok 3 獲得 57 分,大幅超越 DeepSeek-V3 的 36 分。
MMLU 評(píng)測(cè):Grok 3 在多領(lǐng)域知識(shí)測(cè)試中的得分正快速追趕 ChatGPT 等主要競(jìng)爭(zhēng)對(duì)手。

發(fā)布會(huì)現(xiàn)場(chǎng),xAI的工程師團(tuán)隊(duì)展示了Grok 3和其輕量版Grok-3 Mini的強(qiáng)大功能,表明其在多方面的能力已超越或接近了Gemini、DeepSeek和ChatGPT等競(jìng)爭(zhēng)產(chǎn)品。在實(shí)時(shí)演示中,Grok 3表現(xiàn)出了驚人的代碼生成和推理能力。當(dāng)團(tuán)隊(duì)要求Grok 3生成一段太空發(fā)射的3D動(dòng)畫(huà)代碼時(shí),它迅速完成了任務(wù),并呈現(xiàn)出飛船往返地球與火星的動(dòng)畫(huà),這不僅展現(xiàn)了其在復(fù)雜代碼生成方面的能力,還證明了它對(duì)物理原理的理解。

在接下來(lái)的任務(wù)中,Grok 3又被要求設(shè)計(jì)一個(gè)類似俄羅斯方塊的游戲,并在短時(shí)間內(nèi)提供了切實(shí)可行的解決方案,進(jìn)一步驗(yàn)證了其在游戲開(kāi)發(fā)領(lǐng)域的潛力。
Grok 3核心技術(shù)突破之一是“思維鏈”(Chain of Thought)推理機(jī)制,使得GroK 3能夠像人類一樣分步驟處理復(fù)雜問(wèn)題,大幅提升了邏輯推理和連貫性。馬斯克表示,Grok 3在邏輯推理測(cè)試中的表現(xiàn)已經(jīng)優(yōu)于ChatGPT-5和谷歌的Gemini Ultra,并且它具備更強(qiáng)的創(chuàng)造性思維和問(wèn)題解決能力。
Grok 3的成功不僅得益于全新技術(shù)架構(gòu)的加持,更離不開(kāi)強(qiáng)大的算力支持。通過(guò)在訓(xùn)練過(guò)程中使用10萬(wàn)塊Nvidia H100 GPU,相較于前代1.5萬(wàn)塊GPU,實(shí)現(xiàn)了算力的跨越式提升。這種規(guī)?;挠?jì)算能力證明,即便是像DeepSeek這樣的現(xiàn)有大模型,借助大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù),只需少量標(biāo)注數(shù)據(jù)便能顯著提升模型性能。這一進(jìn)步不僅降低了對(duì)海量標(biāo)注數(shù)據(jù)的依賴,也大幅提高了訓(xùn)練效率和降低了訓(xùn)練及推理成本,為業(yè)界帶來(lái)了一種更高性價(jià)比的解決方案。
同時(shí),Grok 3的表現(xiàn)也驗(yàn)證了全球最大的GPU計(jì)算集群在訓(xùn)練模型時(shí)仍然能帶來(lái)卓越的性能,這說(shuō)明Scaling Law尺度法則依然成立,盡管適用場(chǎng)景更為限定。10萬(wàn)塊H100的算力優(yōu)勢(shì)依舊不容小覷,充分展示了在大模型時(shí)代,強(qiáng)大算力依然是實(shí)現(xiàn)突破性進(jìn)展的關(guān)鍵因素。這一現(xiàn)象無(wú)疑將推動(dòng)整個(gè)行業(yè)在AI研發(fā)上的進(jìn)一步探索和投資。
x.AI稱,Grok 3已經(jīng)接入馬斯克旗下的社交平臺(tái)X,用戶可以在該平臺(tái)體驗(yàn)到這一最新AI技術(shù)。然而大模型之家注意到,截至發(fā)稿,X平臺(tái)尚未正式Grok 3大模型。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




