- +1
量化巨頭發(fā)布第一代大模型:免費(fèi)商用,完全開(kāi)源
量化巨頭幻方開(kāi)發(fā)的大模型來(lái)了!
11月2日晚間,幻方宣布,探索AGI(通用人工智能)的新組織“深度求索(DeepSeek)”在成立半年后,發(fā)布第一代大模型——開(kāi)源代碼大模型DeepSeek Coder,已經(jīng)開(kāi)放內(nèi)測(cè),免費(fèi)商用,完全開(kāi)源。
公告顯示,DeepSeek Coder模型有指令Python快速寫(xiě)出程序、修改UI(用戶界面)、測(cè)試bug(程序錯(cuò)誤)以及數(shù)據(jù)分析,學(xué)寫(xiě)SQL(數(shù)據(jù)庫(kù)語(yǔ)言)等技能。
據(jù)國(guó)盛證券研報(bào),在云算力端,目前國(guó)內(nèi)只有商湯、百度、騰訊、字節(jié)、阿里和幻方有超過(guò)1萬(wàn)張A100芯片儲(chǔ)備。

性能優(yōu)于GPT3.5-Turbo
11月2日晚間,在成立半年后,幻方宣布,探索AGI(通用人工智能)的新組織“深度求索(DeepSeek)”發(fā)布了第一代大模型DeepSeek Coder,已經(jīng)開(kāi)放內(nèi)測(cè)。
在公告中,DeepSeek Coder展示了用Python寫(xiě)一個(gè)貪吃蛇游戲,隨著屏幕快速輸出跳躍的代碼,一段可直接運(yùn)行的游戲代碼即可生成;指揮DeepSeek Coder修改UI,輕松寫(xiě)出更難的2048游戲等。此外,DeepSeek Coder還能測(cè)試bug;作為數(shù)據(jù)分析的好幫手,學(xué)寫(xiě)SQL也是其必備技能等。
據(jù)介紹,目前DeepSeek Coder已經(jīng)開(kāi)放內(nèi)測(cè)。DeepSeek Coder已開(kāi)源7B,33B全系列模型,包含Base模型和指令調(diào)優(yōu)模型。在國(guó)際權(quán)威數(shù)據(jù)集HumanEval編程多語(yǔ)言測(cè)試上,DeepSeek Coder在各個(gè)語(yǔ)言上的表現(xiàn)都領(lǐng)先已有的開(kāi)源模型。
此外,據(jù)介紹,與之前最好的開(kāi)源大模型CodeLlama相比,DeepSeek Coder在代碼生成任務(wù)上(使用標(biāo)準(zhǔn)數(shù)據(jù)集HumanEval、MBPP和DS-1000進(jìn)行評(píng)測(cè))分別領(lǐng)先9.3%、10.8%和5.9%。其中DeepSeek Coder的70億參數(shù)版本在代碼能力上達(dá)到了CodeLlama的340億參數(shù)水平。經(jīng)過(guò)指令調(diào)優(yōu)后的DeepSeek Coder模型更是全面超越了GPT3.5-Turbo。
今年4月,幻方量化發(fā)布公告稱,公司將集中資源和力量,全力投身到服務(wù)于全人類共同利益的人工智能技術(shù)之中,成立新的獨(dú)立研究組織,探索AGI的本質(zhì)?;梅綄⑦@個(gè)新組織命名為“深度求索(DeepSeek)”。
公開(kāi)信息顯示,“深度求索”的公司名稱是杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立日期是2023年7月17日,寧波程恩企業(yè)管理咨詢合伙企業(yè)持股99%,幻方量化實(shí)控人梁文鋒持股1%,法定代表人為裴湉。

探索AGI并非用來(lái)炒股
幻方量化是量化私募中的頭部公司,管理規(guī)模曾一度突破千億元大關(guān)?;梅焦倬W(wǎng)顯示,其在2018年就確立以AI為公司的主要發(fā)展方向。
2020年開(kāi)始,幻方累計(jì)投資超億元、占地面積相當(dāng)于一個(gè)籃球場(chǎng)的AI超級(jí)計(jì)算機(jī)“螢火一號(hào)”正式投入運(yùn)作,號(hào)稱可以匹敵4萬(wàn)臺(tái)個(gè)人電腦的超級(jí)算力。2021年,幻方投入十億建設(shè)“螢火二號(hào)”,以“任務(wù)級(jí)分時(shí)共享”為核心理念,調(diào)度系統(tǒng)秒級(jí)響應(yīng),平臺(tái)配備強(qiáng)大的軟件層支持:高性能算子庫(kù)(hfai.nn)、分布式訓(xùn)練通訊框架(hfreduce)、專為AI開(kāi)發(fā)而生的大容量高帶寬文件系統(tǒng)(3FS),讓AI模型能自如拓展到多節(jié)點(diǎn)之上,進(jìn)行大規(guī)模并行訓(xùn)練,算力擴(kuò)容翻倍,集群連續(xù)滿載運(yùn)行,平均占用率達(dá)到96%以上。
幻方表示,多年以來(lái),該公司堅(jiān)持把營(yíng)收的大部分投入人工智能領(lǐng)域,建設(shè)領(lǐng)先的AI硬件基礎(chǔ)設(shè)施,進(jìn)行大規(guī)模的研究,探索人類未知的奧秘,“我們相信幾乎所有的創(chuàng)新都是從大膽嘗試和點(diǎn)滴積累中孕育而來(lái)?!?/p>
梁文鋒此前在接受采訪時(shí)曾表示,幻方的主要班底里,很多人是做人工智能的,“當(dāng)時(shí)我們嘗試了很多場(chǎng)景,最終切入了足夠復(fù)雜的金融,而通用人工智能可能是下一個(gè)最難的事之一。語(yǔ)言大模型可能是通往AGI的必經(jīng)之路,并且初步具備了AGI的特征,所以我們會(huì)從這里開(kāi)始,后邊也會(huì)有視覺(jué)等。”
曾有傳言指出幻方探索AGI是用來(lái)炒股,幻方量化CEO陸政哲此前曾表示:“我們探索AGI不是用來(lái)炒股的,是做GTP相關(guān)的大模型,與金融無(wú)關(guān)。我們獨(dú)立于投資新成立了一個(gè)團(tuán)隊(duì),相當(dāng)于二次創(chuàng)業(yè),從事的是科技方向,只是大家習(xí)慣把我們局限在投資領(lǐng)域?!?/p>
值得一提的是,幻方量化作為一家頭部量化私募,10月26日有傳聞稱該公司宣布暫停渠道募資。不過(guò),幻方量化相關(guān)人士當(dāng)時(shí)回應(yīng)澎湃新聞?dòng)浾叻Q,募資已經(jīng)停止很久了,2021年12月就暫停了,幻方量化當(dāng)前的基金管理規(guī)模是400多億元,這個(gè)規(guī)模目前看是策略比較合適的規(guī)模。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




