- +1
千問、靈光、夸克,阿里AI瘋狂“補(bǔ)課”

押上全家桶,能贏嗎?
定焦One(dingjiaoone)原創(chuàng)
作者 | 王璐
編輯 | 魏佳
阿里在C端AI產(chǎn)品上的密集布局,正引發(fā)行業(yè)新一輪關(guān)注。短短半個月里,阿里系連續(xù)推出兩款重磅產(chǎn)品——阿里集團(tuán)戰(zhàn)略級應(yīng)用千問APP與螞蟻集團(tuán)的全模態(tài)通用AI助手靈光APP,陣仗之大,頗為少見。
放眼全球AI To C賽道,市場競爭早已進(jìn)入白熱化:海外市場,ChatGPT牢牢占據(jù)用戶心智;國內(nèi)賽場則是硝煙彌漫,豆包已超越DeepSeek躋身月活TOP1,騰訊元寶、Kimi等無論是大廠出品還是創(chuàng)業(yè)公司的先發(fā)產(chǎn)品,都已積累了一批較為穩(wěn)定的用戶群。阿里此時入局,難免顯得姍姍來遲。
但它并非毫無底氣,一方面源于技術(shù)沉淀,千問并非從零打造,而是由此前的通義APP與夸克AI對話助手升級而來,核心依托阿里通義實(shí)驗(yàn)室最強(qiáng)的Qwen3-Max模型;另一方面則來自阿里系生態(tài)優(yōu)勢,用戶可在千問中直接調(diào)用淘寶、閑魚等多款應(yīng)用的相關(guān)功能。
從目前的反饋來看,用戶喜憂參半:支持者稱贊千問在推理、編程等復(fù)雜場景下的表現(xiàn)亮眼,且生態(tài)聯(lián)動的設(shè)想具備獨(dú)特吸引力;質(zhì)疑者則認(rèn)為,千問的綜合實(shí)力與同類AI助手相比并無突出優(yōu)勢,所謂的“生態(tài)聯(lián)動”仍停留在基礎(chǔ)層面,大多需要跳轉(zhuǎn)鏈接才能完成操作。
而在阿里系內(nèi)部,“夸克+千問+靈光”的多產(chǎn)品并行,更讓從業(yè)者拋出了三個核心疑問:千問的真實(shí)實(shí)力在行業(yè)中究竟處于何種水平?在ChatGPT、豆包等玩家早已站穩(wěn)腳跟的當(dāng)下,阿里此時入場是否為時已晚?多個C端產(chǎn)品并行的布局策略,是否會導(dǎo)致研發(fā)、流量、營銷等資源分散,反而難以形成合力?
全能的千問,離ChatGPT還有差距
作為全面對標(biāo)ChatGPT的產(chǎn)品,千問APP的產(chǎn)品形態(tài)和市面上大部分AI助手區(qū)別不大,采用對話式交互、布局簡潔的設(shè)計邏輯,用戶點(diǎn)進(jìn)去能清晰看出各功能分區(qū)。
比如用戶可在頁面頂部切換模型(Qwen3-千問和Qwen3-Max雙模型),前者負(fù)責(zé)回答有關(guān)生活中的常見問題,后者主攻推理、代碼生成等更為復(fù)雜的任務(wù);中部是對話結(jié)果展示區(qū),顯示聊天回復(fù)和生成內(nèi)容;底部則為功能導(dǎo)航欄和問題輸入?yún)^(qū),包含、文字、語音、拍照和多功能入口。

AI應(yīng)用的核心競爭力來源于底層大模型能力,千問APP依托的是Qwen系列模型,并接入了通義實(shí)驗(yàn)室最強(qiáng)大的Qwen3-Max,雖然這一模型尚未開源,但綜合官方公布的各項(xiàng)測試結(jié)果和從業(yè)者的使用體驗(yàn),大家也能對千問的實(shí)力作出基本判斷。
一位大模型從業(yè)者表示,大模型實(shí)力可從語言理解與生成準(zhǔn)確性、數(shù)學(xué)與復(fù)雜推理、編程與代碼生成、多模態(tài)、生態(tài)整合五個維度進(jìn)行評判,我們也圍繞上述幾大方面對千問進(jìn)行分析。
語言理解與生成準(zhǔn)確性是大模型的基本功,考驗(yàn)其對多語言、方言及歧義句的理解能力,以及按需生成總結(jié)、文案、翻譯等內(nèi)容的水平。
相較于ChatGPT,千問的核心優(yōu)勢在于本土訓(xùn)練數(shù)據(jù)積淀,Qwen3-Max基于36T(tokens)語料訓(xùn)練,覆蓋119種語言,在中文語境表現(xiàn)上更勝一籌,能靈活運(yùn)用成語、方言及網(wǎng)絡(luò)新梗。
比如面對“這家店的火鍋好吃絕絕子,栓Q!”這一流行語,千問和ChatGPT均能解讀出“火鍋非常好吃,感謝”的核心含義,但千問還能捕捉“栓Q”背后“無語卻仍想感謝”的微妙社交潛臺詞。
不過多位從業(yè)者表示,當(dāng)前各大模型在表層標(biāo)準(zhǔn)任務(wù)的語言能力上差距不大,真正的區(qū)分更多體現(xiàn)在含推理的復(fù)雜場景中,集中在數(shù)學(xué)與復(fù)雜推理和編程與代碼生成兩方面能力上。
其中,數(shù)學(xué)與復(fù)雜推理能力可以簡單理解為,大模型能否解決多步驟數(shù)學(xué)和復(fù)雜推理題。一位從業(yè)者表示,千問系列模型已達(dá)到開源第一梯隊水平,特別是在數(shù)學(xué)競賽、金融分析等特定場景中保持領(lǐng)先。
數(shù)據(jù)顯示,Qwen3-max-thinking處在半成品(早期預(yù)覽版)階段時,便在AIME 2025和HMMT(哈佛-MIT數(shù)學(xué)錦標(biāo)賽)的推理測試中拿到100%準(zhǔn)確率的優(yōu)秀成績。
而編程與代碼生成是目前大模型技術(shù)落地最為成熟的領(lǐng)域之一,千問的技術(shù)表現(xiàn)符合行業(yè)預(yù)期。其優(yōu)勢集中在中文編程適配與特定評測指標(biāo)上,能生成可執(zhí)行代碼、調(diào)試錯誤、優(yōu)化邏輯,適配不同編程語言和場景。
最后是多模態(tài)與生態(tài)整合能力,代表著大模型是否可以從“能用”發(fā)展到“好用”,也是當(dāng)前行業(yè)競爭的核心戰(zhàn)場。其中多模態(tài)相當(dāng)于大模型的“感官”,集中體現(xiàn)在文字、圖片、音視頻等輸入輸出形式上,生態(tài)整合代表大模型“手腳”,影響的是Agent能力。
千問整合了文檔處理、代碼開發(fā)、文生圖、圖生視頻等多元功能,形成了較為完整的應(yīng)用生態(tài)閉環(huán),滿足用戶多樣化需求,但多位從業(yè)者指出,它在Agent能力上還有明顯短板。
比如,讓千問“規(guī)劃一次完整出差”時,其無法像ChatGPT那樣高效地整合多工具、多步驟信息,生成全面且可執(zhí)行的規(guī)劃方案,更多時候需要用戶額外提供細(xì)節(jié)或進(jìn)行多輪交互來逐步完善計劃。
資深從業(yè)者趙江杰對「定焦One」表示,這本質(zhì)是技術(shù)架構(gòu)選擇的差異,千問采用的是基于場景適配的專有Agent方案,僅在部分特定場景中專門構(gòu)建了能完成對應(yīng)任務(wù)的Agent,比如提供DeepResearch和PPT制作服務(wù)的Agent;而在沒有配備專有Agent的場景下,會直接調(diào)用大模型,無法像專有Agent那樣通過多步驟規(guī)劃-執(zhí)行迭代實(shí)現(xiàn)對應(yīng)的效果。
ChatGPT Agent則不同,它采用的是端到端模型訓(xùn)練的通用Agent技術(shù)方案。在Agent模式下,無論輸入何種需求,都會統(tǒng)一通過這個通用Agent來處理。不過需要說明的是,ChatGPT Agent在不少任務(wù)的執(zhí)行效果上,比不上專有Agent。
打個比方,千問的專有Agent就像醫(yī)院里的??漆t(yī)生,針對特定病癥(場景)能給出精準(zhǔn)高效的治療方案;而ChatGPT的通用Agent則像全科醫(yī)生,能應(yīng)對各類常見需求,但遇到需要深耕的“專科問題”時,專業(yè)性就不如專科醫(yī)生了。
總體來看,千問的整體表現(xiàn)居開源大模型的頂尖行列,正持續(xù)追趕第一梯隊頂級閉源模型的能力,但現(xiàn)階段與ChatGPT相比,仍存在一定差距。
阿里現(xiàn)在做C端入口,不算遲
除了技術(shù)實(shí)力,阿里在C端賽道的入局時機(jī)也是外界關(guān)注的焦點(diǎn)。在豆包、DeepSeek、騰訊元寶、Kimi、文小言等競品早已搶先落地的背景下,千問顯得晚來一步。
千問于11月才推出,暫無最新數(shù)據(jù),我們可以從更早的公開數(shù)據(jù)觀察其前身的用戶基礎(chǔ)。QuestMobile數(shù)據(jù)顯示,豆包和DeepSeek的9月月活(MAU)過億,反觀通義(現(xiàn)千問)僅有306萬左右。

起跑線存在差距,但不代表著千問完全沒有反超的機(jī)會,核心機(jī)遇來自兩方面。
一方面,目前AI應(yīng)用的用戶忠誠度不高。
最明顯的案例是Kimi,它去年靠投流獲取了大量用戶,但在今年被DeepSeek反超,證明AI產(chǎn)品依然可以憑借技術(shù)實(shí)力贏得用戶。AI產(chǎn)品榜最新的10月榜單也顯示,ChatGPT、豆包、夸克等頭部AI助手的月活均增長緩慢,DeepSeek甚至還出現(xiàn)了倒退。更有專家公開表示,許多AI應(yīng)用的首月用戶流失率高達(dá)80%甚至90%。
這意味著,AI賽道尚未形成固化的用戶格局,只要產(chǎn)品足夠智能、好用,就有望快速吸引用戶遷移。
另一方面,阿里的資金、生態(tài)和開源優(yōu)勢,是千問的后盾。
千問依托阿里云,能獲得充足的底層算力支持;阿里系內(nèi)部的淘寶、支付寶、高德等豐富垂類場景,為其帶來了獨(dú)特的數(shù)據(jù)優(yōu)勢;同時阿里在AI領(lǐng)域的持續(xù)人才投入,也讓千問的技術(shù)研發(fā)有了可靠保障。
算力、數(shù)據(jù)、人才三者的結(jié)合,為千問大模型提供了技術(shù)基礎(chǔ)。而開源策略進(jìn)一步加速了千問的模型迭代與生態(tài)建設(shè)。
阿里對Qwen系列采用“核心旗艦?zāi)P烷]源+輕量版本開源”的組合策略,相比純閉源模式,這種方式既能讓千問團(tuán)隊認(rèn)知自身模型的優(yōu)劣,還能吸引全球開發(fā)者參與共建生態(tài),幫助千問實(shí)現(xiàn)更廣泛的場景覆蓋。英偉達(dá)的CEO黃仁勛在2025GTC大會上就曾提到,Qwen已占據(jù)全球開源模型的主要市場份額,且仍在持續(xù)擴(kuò)大。
值得注意的是,阿里系的生態(tài)優(yōu)勢目前尚未完全發(fā)揮。
理論上,千問可與淘寶、支付寶等實(shí)現(xiàn)賬號無縫登錄與數(shù)據(jù)打通,借助高德、飛豬、餓了么等內(nèi)部系統(tǒng)的標(biāo)準(zhǔn)化接口,降低工具調(diào)用的協(xié)調(diào)成本,最終實(shí)現(xiàn)從“對話咨詢”到“完成支付”的端到端服務(wù)閉環(huán)。
但目前無論是ChatGPT,還是豆包、元寶、Kimi等國內(nèi)競品,都還停留在“導(dǎo)購+跳鏈”的初級階段,尚未打通完整的Agent服務(wù)鏈路。趙江杰表示,千問當(dāng)前也難以實(shí)現(xiàn)這一目標(biāo)。
問題在于行業(yè)共性的技術(shù)瓶頸,“大模型還不能充分理解復(fù)雜場景需求,多App協(xié)同的邏輯設(shè)計仍不完善,Agent技術(shù)的實(shí)際落地還處于早期階段,即便未來技術(shù)達(dá)到相應(yīng)水平,淘寶、支付寶、高德等APP的API接口并非為Agent量身打造,也會制約生態(tài)聯(lián)動的效率,”他補(bǔ)充,目前千問的生態(tài)聯(lián)動僅體現(xiàn)在部分基礎(chǔ)功能上,比如用戶上傳一雙入門級羽毛球鞋的圖片,千問會跳轉(zhuǎn)至淘寶、閑魚、1688等平臺的搜索鏈接,更深層次的協(xié)同尚未實(shí)現(xiàn)。
總之,當(dāng)前AI賽道的用戶忠誠度尚未固化,千問依托阿里云Infra(算力)、阿里生態(tài)數(shù)字資源(數(shù)據(jù))及阿里AI研究投入(算法),此刻入局還不算太遲。但若想真正發(fā)揮自身獨(dú)有的生態(tài)優(yōu)勢,實(shí)現(xiàn)對競品的反超,關(guān)鍵在于能否突破大模型的核心技術(shù)瓶頸,讓產(chǎn)品能力再上一個臺階。
邁向超級入口,還有內(nèi)外挑戰(zhàn)
千問的最終目標(biāo)是成為一個“超級入口”,不管是生活、工作還是學(xué)習(xí)場景,用戶想獲取信息、解決問題、完成任務(wù),都能在這里搞定。但這條路并不好走,千問要面對的內(nèi)外部問題有很多。
首先是內(nèi)部的“同門競爭”。目前阿里系在C端已經(jīng)推出了三款A(yù)I相關(guān)應(yīng)用:千問、夸克和靈光,它們的功能撞車嚴(yán)重。
這三款里,夸克不是“天生帶AI”的產(chǎn)品,它前身是2016年UC瀏覽器團(tuán)隊推出的夸克瀏覽器,2023年才升級成“一體化AI助手”,核心用的是阿里自研的千問大模型,到了2025年3月,又升級成“AI超級框”,主打在瀏覽器里就能做對話問答、總結(jié)信息、寫內(nèi)容、拍照搜題。
千問和靈光是基于AI技術(shù)打造的“原生應(yīng)用”,兩者的區(qū)別在于,千問是阿里直接開發(fā),靠的是Qwen系列大模型,靈光由螞蟻集團(tuán)推出,背后是自研的百靈大模型。
阿里也給三者定下了不同方向:千問是“通用智能助手”,夸克聚焦“AI搜索+瀏覽器”,靈光則是“全模態(tài)的生產(chǎn)力工具”。以出游場景為例,可以簡單理解為,千問能幫你策劃完整出游,包含具體的預(yù)算和每天的行程;夸克主要幫你列當(dāng)?shù)靥厣包c(diǎn);靈光會直接生成一個有文字有圖片甚至可以互動的旅游小程序。
但實(shí)際體驗(yàn)下來,三者的功能重合度遠(yuǎn)超預(yù)期?!付ń筄ne」讓它們分別規(guī)劃“下周末三天兩晚的兩人親子三亞游”,要求包含預(yù)算、行程、景點(diǎn)和美食,結(jié)果三者給出的內(nèi)容類似,主要區(qū)別在于:
千問給出了最詳細(xì)的行程,以小時為單位。但弄錯了時間,把下周六(11月29日)寫成了11月30日;
夸克按照上午、下午進(jìn)行規(guī)劃,略顯粗糙;
靈光在文字規(guī)劃外還配了大量圖片,形式更為豐富。

從左到右依次為:千問、夸克、靈光
三者給出的預(yù)算也接近,千問給出了(2大1?。┑目傤A(yù)算為4800-6200元;夸克按單人算,分了經(jīng)濟(jì)型、舒適型、品質(zhì)型三檔,最便宜的經(jīng)濟(jì)型1500-2000元/人,和千問的總預(yù)算折算后差不多;靈光給出的人均預(yù)算也在1500-2500元,并在此基礎(chǔ)上做了預(yù)算對比柱狀圖。

靈光的預(yù)算柱狀圖
整體來看,盡管定位各異,但在具體任務(wù)上三者的方案高度趨同,差別更多體現(xiàn)在呈現(xiàn)方式。
趙江杰分析,之所以內(nèi)容重合度較高,特別是夸克和千問的回復(fù),核心原因有兩點(diǎn);一是網(wǎng)上關(guān)于三亞旅游的公開資料信息源相對固定,而大模型本質(zhì)上是對現(xiàn)有信息進(jìn)行組合加工,因此其處理的上下文也比較類似;二是千問和夸克背后均采用Qwen系列大模型,面對這類特定問題時,二者的思考邏輯相近,輸出結(jié)果自然也就趨于一致。
不止一位從業(yè)者覺得,現(xiàn)在夸克和千問的功能重疊嚴(yán)重,甚至千問已經(jīng)涵蓋了夸克的核心功能。趙江杰也認(rèn)為,如果夸克不突出自己的瀏覽器屬性,很容易讓用戶產(chǎn)生用夸克還是千問的認(rèn)知混淆。
此舉也會導(dǎo)致阿里集團(tuán)的資源(比如流量、研發(fā)投入、營銷費(fèi)用)分散投放。而且夸克還在給千問導(dǎo)流,搜索框里專門加了千問按鈕,用戶只需點(diǎn)擊或者滑動,便能直接進(jìn)入千問界面。

從夸克首頁可進(jìn)入千問
除了內(nèi)部競爭,千問還面臨一個關(guān)鍵問題:阿里內(nèi)部各業(yè)務(wù)線愿意給它開放多少核心數(shù)據(jù),直接決定了千問的聰明程度。
比如淘寶是否可以把實(shí)時價格波動、真實(shí)的用戶評論等內(nèi)部數(shù)據(jù)開放給千問,如果只給一些淺層的商品信息,千問就無法根據(jù)用戶的歷史消費(fèi)偏好做精準(zhǔn)推薦,自然也就難和其他競品形成差異化。
但開放核心數(shù)據(jù)又會帶來隱私安全挑戰(zhàn)和用戶信任度的問題,比如讓它推薦一款手機(jī),用戶可能會覺得“這是在為淘寶帶貨”,所以有從業(yè)者認(rèn)為,千問后續(xù)可能還需要接入京東、美團(tuán)這些非阿里系的服務(wù),才能顯得更中立可信。
此外,千問面臨的外部壓力也不小,其他大廠也具備做“AI超級入口”的潛力,比如技術(shù)領(lǐng)先的ChatGPT擁有全球范圍的知識庫,國內(nèi)的字節(jié)豆包、騰訊元寶用戶基數(shù)較大,模型迭代速度也很快。
可以說,千問是阿里押上自身最強(qiáng)技術(shù)、最全生態(tài),在AI的C端戰(zhàn)場上最關(guān)鍵的一次出手。但它離真正的“超級入口”,還有很長的路要走,這也是阿里必須補(bǔ)上的關(guān)鍵一課。
*題圖來源于pexels。
本文為澎湃號作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




