日本护士毛茸茸高潮,亚洲精品自偷自拍无码,久久精品国产一区二区三区,日韩人妻无码免费视频一二区

澎湃Logo
下載客戶端

登錄

  • +1

Manus實(shí)測(cè),它和DeepSeek有什么不同?

澎湃新聞?dòng)浾?孔家興 王亞賽 杜海燕 舒怡爾 實(shí)習(xí)生 梁希昀
2025-03-21 11:59
來(lái)源:澎湃新聞
? 對(duì)齊Lab >
字號(hào)

自3月5日開(kāi)啟內(nèi)測(cè)以來(lái),人工智能應(yīng)用 Manus 出圈走紅。3月12日晚間,Manus在自有 X 賬號(hào)上表示,7天以來(lái)Manus使用申請(qǐng)等候名單增加到兩百萬(wàn)人次。

澎湃新聞·對(duì)齊Lab在獲得內(nèi)測(cè)碼后,使用Manus進(jìn)行了四種任務(wù)測(cè)試。總體而言,Manus作為“開(kāi)箱即用”的創(chuàng)新智能體應(yīng)用有不少優(yōu)點(diǎn):交互界面友好、拆解需求能力強(qiáng)、多AI協(xié)作有條不紊、設(shè)計(jì)功底強(qiáng),但在信息整合能力、細(xì)節(jié)優(yōu)化、交付完成度上還有待提高。

Manus和AI Agent究竟是什么?

有別于之前爆火的DeepSeek,Manus并不是一個(gè)新的人工智能大模型,而是一款讓AI大模型協(xié)作的人工智能體(AI Agent)。也就是說(shuō),Manus不創(chuàng)造大模型,而是使用市面上已經(jīng)存在的大模型打造了一個(gè)為人服務(wù)的“助理”。理論上,AI Agent能夠以類似人類的方式工作,通過(guò)大模型來(lái)“理解”用戶需求,“規(guī)劃”達(dá)成目標(biāo)的路徑,調(diào)用包括大模型在內(nèi)的各種“工具”來(lái)執(zhí)行任務(wù)。

Manus所處的AI Agent賽道剛剛興起,雖然不乏競(jìng)品,卻還沒(méi)有產(chǎn)生現(xiàn)象級(jí)的產(chǎn)品。

Smiliarweb數(shù)據(jù)顯示,在2月全球增速最高的10個(gè)AI產(chǎn)品中,只有Dify一家與Agent概念有關(guān)(Manus目前處于逐步放開(kāi)的測(cè)試階段)。但Dify更準(zhǔn)確的定位是Agent開(kāi)發(fā)平臺(tái),并不是像Manus這樣的AI Agent應(yīng)用。AI產(chǎn)品中流量最高的,還是集中在AI聊天機(jī)器人這個(gè)品類。但從全球AI APP的訪問(wèn)量總榜來(lái)看,除了DeepSeek這樣的新晉爆款,其他高訪問(wèn)量AI產(chǎn)品大多是上榜多時(shí)且存在增長(zhǎng)困難的問(wèn)題。

平均一個(gè)任務(wù)用時(shí)40分鐘,Manus擅長(zhǎng)做什么?

從Manus官方和Discord社區(qū)發(fā)布的測(cè)試案例來(lái)看,網(wǎng)頁(yè)、報(bào)告、PPT是用戶希望Manus生成的主要內(nèi)容產(chǎn)品,符合大部分打工人、學(xué)生群體的需求。

根據(jù)不同的任務(wù)難度,我們分別測(cè)試了Manus在svg圖像生成、數(shù)據(jù)可視化、游戲設(shè)計(jì)、數(shù)據(jù)挖掘、網(wǎng)頁(yè)交互設(shè)計(jì)等方面的能力。

我們使用理解能力、準(zhǔn)確性、設(shè)計(jì)能力和代碼能力這四個(gè)維度,對(duì)Manus測(cè)試過(guò)的四個(gè)任務(wù)進(jìn)行了評(píng)估。Manus最擅長(zhǎng)的是理解需求后拆解任務(wù),在不同任務(wù)難度下均能達(dá)到7分以上的標(biāo)準(zhǔn)(滿分10分)。此外,Manus的網(wǎng)頁(yè)設(shè)計(jì)能力和審美也值得稱贊。在“小王子智能體世界”項(xiàng)目中,Manus在沒(méi)有提示詞的引導(dǎo)下,通過(guò)理解故事和設(shè)定自主完成了風(fēng)格化的設(shè)計(jì)。

Manus 的工作原理是使用多個(gè) AI 模型協(xié)同決策,這些 AI 模型會(huì)自動(dòng)拆解任務(wù)目標(biāo)、生成執(zhí)行計(jì)劃,調(diào)用工具接口完成文件操作、數(shù)據(jù)處理等任務(wù),并實(shí)時(shí)根據(jù)反饋動(dòng)態(tài)調(diào)整策略,實(shí)現(xiàn)復(fù)雜任務(wù)的自主執(zhí)行,從而實(shí)現(xiàn)一句提示詞就將任務(wù)執(zhí)行到底的效果。Manus 的所有工作流程均在云端虛擬機(jī)上完成。

提示詞和參考資料越詳細(xì),項(xiàng)目的完成效果可能越好?!吧虾Yp櫻地圖網(wǎng)頁(yè)”的項(xiàng)目里,我們將上海市各區(qū)的賞櫻地點(diǎn)、花期等信息整理成表格喂給Manus,生成內(nèi)容的質(zhì)量明顯提升,任務(wù)用時(shí)也是4個(gè)任務(wù)中最短的。可見(jiàn),信息檢索和數(shù)據(jù)爬取等內(nèi)容整合工作,是比較費(fèi)時(shí)費(fèi)力的。

為了更好地說(shuō)明Manus的工作原理,我們?cè)谏虾Yp櫻地圖的任務(wù)回放基礎(chǔ)上,制作了一個(gè)解釋Manus工作流程的視頻。

AI永遠(yuǎn)“使命必達(dá)”,幻覺(jué)問(wèn)題更加凸顯

在 Manus 執(zhí)行任務(wù)的各個(gè)環(huán)節(jié)中,我們最關(guān)心的是資料和數(shù)據(jù)收集的準(zhǔn)確性及整合能力。在 “模擬投資網(wǎng)頁(yè)游戲” 中,我們要求 Manus 生成不同歷史階段的投資標(biāo)的數(shù)據(jù)。以梳理 2005 年每月黃金價(jià)格為例,Manus 的梳理方法是依據(jù)新聞報(bào)道篩選出核心事件,比如 “2005 年,黃金價(jià)格突破 450 美元 / 盎司”,然后結(jié)合相關(guān)歷史數(shù)據(jù)和統(tǒng)計(jì)方法,通過(guò)特定算法生成模擬趨勢(shì)的數(shù)據(jù)。

通過(guò)核查2005年的黃金價(jià)格后可知,2005年全球黃金市場(chǎng)的月均價(jià)格確實(shí)一度超過(guò)了450 美元 / 盎司,但Manus提供的每月黃金數(shù)據(jù)與真實(shí)數(shù)據(jù)均有不同程度的偏差。也就是說(shuō),這些數(shù)據(jù)是 AI 在滿足當(dāng)年突破 450 美元這一點(diǎn)的基礎(chǔ)上“填空”出來(lái)的。然而,這個(gè)生造數(shù)據(jù)的過(guò)程, AI 并不會(huì)告訴你。這也就是各家大模型都在努力解決的 AI 幻覺(jué)問(wèn)題,Manus 調(diào)用的是現(xiàn)成的大模型,也自然存在著這樣的幻覺(jué)問(wèn)題。

圖中顯示,Manus基于歷史數(shù)據(jù)模擬了數(shù)據(jù)的趨勢(shì)。圖片來(lái)源:澎湃新聞·對(duì)齊Lab Manus實(shí)測(cè)

如果不去細(xì)摳任務(wù)中的各個(gè)環(huán)節(jié),不論是網(wǎng)頁(yè)、PPT還是報(bào)告,Manus的工作成果可以用可圈可點(diǎn)來(lái)形容。加上Manus允許用戶實(shí)時(shí)觀看自己的操作過(guò)程,給人一種信賴感。這種產(chǎn)品設(shè)計(jì)上的技巧,規(guī)避了AI的一些能力不足的問(wèn)題。

這是市面上一些大模型和AI應(yīng)用的通病,通過(guò)營(yíng)造出一種什么問(wèn)題都能解決的氛圍,來(lái)滿足市場(chǎng)和用戶的期待。尤其是在需求溝通、任務(wù)執(zhí)行和總結(jié)匯報(bào)上,AI給出的范式總是有模有樣。加上擅長(zhǎng)“高情商的表達(dá)”,給用戶提供了很多情緒價(jià)值。但仔細(xì)去核驗(yàn)的話,幻覺(jué)、誤用、不準(zhǔn)確等問(wèn)題其實(shí)并不少見(jiàn)。畢竟在激烈的競(jìng)爭(zhēng)中,AI是不會(huì)輕易和你說(shuō)它做不到的。

從實(shí)測(cè)體驗(yàn)來(lái)說(shuō),以Manus為代表的AI Agent確實(shí)在把完成一件事的門檻越拉越低,但也把做好一件事的標(biāo)準(zhǔn)越拉越高。越是對(duì)創(chuàng)意有著高要求,對(duì)內(nèi)容準(zhǔn)確性、真實(shí)性近乎嚴(yán)苛的領(lǐng)域,流程化的工具就只能陪你半程。更加精準(zhǔn)地理解世界、理解人類,將成為決定工作品質(zhì)與成果的關(guān)鍵,讓個(gè)人在未來(lái)的競(jìng)爭(zhēng)格局中占據(jù)一席之地。

作為一個(gè)串聯(lián)AI大模型的工具,Manus也有很多當(dāng)下大模型的通病。但在涉及隱私等重要的細(xì)節(jié)問(wèn)題上,Manus的很多處理方式還是值得借鑒的。比如,Manus不會(huì)使用用戶提供的API,哪怕你強(qiáng)制要求它使用;在涉及兒童相關(guān)的內(nèi)容時(shí),即便沒(méi)有提示詞的引導(dǎo),Manus也會(huì)加上一個(gè)工作步驟,去驗(yàn)證內(nèi)容和設(shè)計(jì)是不是適合兒童觀看;Manus會(huì)讓用戶選擇是否將項(xiàng)目部署到公網(wǎng)。這些機(jī)制和設(shè)定,都能體現(xiàn)一款產(chǎn)品對(duì)人的尊重和保護(hù)。

在每一次等待 Manus 創(chuàng)作的過(guò)程中,雖然實(shí)際時(shí)長(zhǎng)遠(yuǎn)遠(yuǎn)短于人類自己創(chuàng)作的時(shí)長(zhǎng),但期盼的心情總釀成一種度秒如年的感受。

這種感受,就像在電腦剛剛普及的年代,你守在一臺(tái)老式電腦前,眼巴巴地看著一張圖像逐行加載。每一行像素的顯現(xiàn),都勾得人心癢癢。那一刻,就仿佛望向互聯(lián)網(wǎng)時(shí)代的大門。而現(xiàn)如今, AI 雖有各種不完美,但也同樣給人一種希望,新技術(shù)引領(lǐng)的新時(shí)代又再次開(kāi)啟了。

澎湃新聞·對(duì)齊Lab Manus實(shí)測(cè)項(xiàng)目回看:

1、上海賞櫻數(shù)據(jù)可視化項(xiàng)目設(shè)計(jì),https://manus.im/share/Pihrl1JUmNZ0moPhoWfyh6?replay=1

2、AI公司產(chǎn)品的交互式可視化網(wǎng)頁(yè)設(shè)計(jì),https://manus.im/share/MoZ9vlZnUVWnuG49BNFqjG?replay=1

3、小王子世界觀AI代理網(wǎng)頁(yè)游戲設(shè)計(jì),https://manus.im/share/5ZuJ0R75Clzr7X6iaNLFNb?replay=1

4、什么是AI大模型的通俗講解SVG卡片,https://manus.im/share/uytfTaasg9O9JpPnJU40jx?replay=1

    責(zé)任編輯:呂妍
    校對(duì):張艷
    澎湃新聞報(bào)料:021-962866
    澎湃新聞,未經(jīng)授權(quán)不得轉(zhuǎn)載
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號(hào)

            滬公網(wǎng)安備31010602000299號(hào)

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116

            ? 2014-2025 上海東方報(bào)業(yè)有限公司

            反饋
            久久久久,妇女| 亚洲精品国产字幕久久麻豆| 成人性色生活片免费看爆迷你毛片| 免费吃奶摸下激烈视频青青网| 99成人动漫| 特黄三级又爽又粗又大| 成人性能视频在线| 久久久国产精品毛片| 樱花草在线社区www| 日韩1000sahjenb| 久久久无码精品午夜| 人人色人人操,人人操,人人摸| 国产精品成人无码a 无码| 99久久精品午夜一区二区| 色欲av偷偷偷偷| 无码综合天天久久综合网| 国产美女视频免费的| 国产欧美成人一区二区a片| www.76me奇米影视第四色| 国产精品久久久久久久久kt| 寂寞少妇啊轻点灬太粗太长了视频 | 97一区二区国产好的精华液| 国产精品亚洲精品久久精品 | 色偷偷www.8888在线观看| 少妇打炮草出白浆无码在线| 搡老熟女700| 精品乱子伦一区二区三区| 99久久99久久免费精品小说| 隔着超薄丝袜进入的片| 欧美白人做受XXXX视频| 91在线激情在线观看| 韩国午夜福利一区二区| 激情性爽三级成人| 免费网站看V片18禁无码在线播放| 色伊人久久综合中文字幕| 色88久久久久高潮综合影院| 国产成人午夜福利在线观看 | 欧美致敬很多经典的黑白mv| 久久久久久久亚洲精品汤唯换脸| freexxx性日韩| 国产成在线观看免费视频 |