- +1
觀察丨數(shù)據(jù)困境與模型挑戰(zhàn)并存,AI智能體與機器人如何破局

9月10日-13日,2025 Inclusion·外灘大會在上海舉行,AI無疑成為本屆大會最受關(guān)注的焦點。
在多個論壇中,行業(yè)專家、企業(yè)家與投資人展開了熱烈討論,深入探討了當前行業(yè)發(fā)展所面臨的挑戰(zhàn)。在算力爆發(fā)與模型創(chuàng)新的關(guān)鍵階段,無論是聚焦物理實體的機器人,還是專注于數(shù)字世界的智能體(Agent),都共同面對著數(shù)據(jù)質(zhì)量、模型能力與產(chǎn)業(yè)化落地的多重挑戰(zhàn)。
數(shù)據(jù)困境與模型挑戰(zhàn),機器人何時能進入家庭
在大會主論壇的圓桌環(huán)節(jié),宇樹科技創(chuàng)始人、CEO王興興反復提及“數(shù)據(jù)”問題:真正優(yōu)質(zhì)數(shù)據(jù)怎么采?數(shù)據(jù)質(zhì)量應(yīng)該達到什么標準?當前應(yīng)該采集什么類型、多大規(guī)模的數(shù)據(jù)?哪些數(shù)據(jù)比較有價值應(yīng)該重點采集?
王興興指出,目前機器人的數(shù)據(jù),無論采集、噪聲、數(shù)據(jù)質(zhì)量問題都非常大,“都還是比較模糊的階段”。
他表示,希望能通過提高數(shù)據(jù)的利用率、提升模型對數(shù)據(jù)的理解能力,實現(xiàn)用少量數(shù)據(jù)也能獲得良好的效果。而從模型的角度,很多情況下數(shù)據(jù)并非要單純從量的角度來衡量,有些特征性數(shù)據(jù)非常重要,比如機器人到底哪些動作或場景怎么采集會比較有質(zhì)量。
在一場分論壇上,銀河通用聯(lián)合創(chuàng)始人張直政則強調(diào),具身大模型的發(fā)展可能需要上萬億條數(shù)據(jù)。
張直政認為,若全部用真實數(shù)據(jù)采集既不可行也不可持續(xù),即便同一個人重復相同動作,每次的一致性都很差,導致真實數(shù)據(jù)的樣本效率極低。而仿真數(shù)據(jù)在可控性和規(guī)?;矫婢哂袠O大優(yōu)勢,雖然其在物理和語義學習上不如真實數(shù)據(jù),但可以通過圖文大模型和數(shù)字大模型來彌補。
清華大學交叉信息研究院助理教授、具身智能實驗室負責人、星海圖聯(lián)合創(chuàng)始人許華哲也在大會期間表示,真實數(shù)據(jù)雖然比較昂貴,但是質(zhì)量非常好,仿真和互聯(lián)網(wǎng)數(shù)據(jù)可能更便宜、更容易獲取,但與真實數(shù)據(jù)的質(zhì)量會仍存在差距。不過,即便采用真實數(shù)據(jù),也存在“真實到真實的差距”(Real2real Gap),影響訓練出的VLA(視覺-語言-動作模型)最終質(zhì)量。
模型則是機器人的另一個瓶頸。王興興指出,對于機器人而言,最大的問題還是AI模型沒辦法很好地把硬件用起來,比如靈巧手。同時,目前純語言模型或純視頻模型效果顯著,但一旦需要將語言與圖像深度融合,就面臨巨大挑戰(zhàn),特別是在機器人控制領(lǐng)域,如何讓生成視頻與機器人的控制模態(tài)精確對齊,至今仍面臨難題。
如何解決靈巧手的難題?靈心巧手聯(lián)合創(chuàng)始人兼首席AI架構(gòu)師蘇洋給出了他的答案。
蘇洋表示,就像預訓練模型需要大量數(shù)據(jù)一樣,如果能有1萬臺、10萬臺、100萬臺設(shè)備,真機數(shù)據(jù)采集會變得異常容易,真實數(shù)據(jù)采集的價格也會變得異常低。
同時,蘇洋還指出,目前靈巧手占人形機器人成本的比例大約在21%-23%。他希望能夠造更多、更便宜的靈巧手,爭取三年內(nèi)將價格“打到”500元甚至100元,“這時候機器人就能進家庭了,我們先做工業(yè)把它用得穩(wěn)定,在苛刻的環(huán)境下把穩(wěn)定性、可靠性、靈巧性都解決了,然后壓低成本,進入千家萬戶”。
國家地方共建人形機器人創(chuàng)新中心首席科學家江磊指出,當前具身智能的路徑還遠未收斂,“但好在目前具身智能的四條路徑——智駕、機械臂、腿足式機器人以及芯片,就像四條產(chǎn)業(yè)鏈的射線,當有一天集中于一個點的時候,可能具身智能這個產(chǎn)業(yè)就能落地”。
留給智能體的窗口時間不多了,產(chǎn)業(yè)將趨分化
業(yè)界普遍認為,今年將會是AI智能體的元年。在本次大會上,展區(qū)內(nèi)的各類智能體功能齊備,數(shù)不勝數(shù)。
BAI資本創(chuàng)始及管理合伙人龍宇則坦言,智能體的概念其實也還在被定義和落地過程當中,處于大家不斷努力的過程當中。
她認為,當前用戶端、消費者、企業(yè)端給予所謂的智能體概念極大前所未有的寬容,愿意接受30%-60%的完成度,這在傳統(tǒng)企業(yè)級服務(wù)中是不可想象的。不過,這種寬容并非沒有期限。龍宇強調(diào)“留給我們的窗口時間已經(jīng)不多了”,隨著token成本的大幅下降,一些重新設(shè)計和優(yōu)化構(gòu)架以及工作流的可能性已經(jīng)出現(xiàn),大家會對智能體交付的完成程度越來越較真,特別是在金融等高風險領(lǐng)域,容不得半點容錯率,不是“做得還不錯”就可以接受的。
RockFlow創(chuàng)始人、CEO Vakee也指出,目前大模型在垂直領(lǐng)域的數(shù)據(jù)是缺乏的,在金融領(lǐng)域的落地對于準確性的要求非常高,同時強監(jiān)管的場景性質(zhì)也需要算法具備可解釋性。
對于行業(yè)未來,龍宇表示,半年前還備受關(guān)注的Devin等垂直Agent,現(xiàn)在已經(jīng)較少被提及,“目前技術(shù)已經(jīng)夠用,關(guān)鍵是定義出新的交互范式,而非產(chǎn)品形態(tài)”。未來,智能體將會是產(chǎn)業(yè)分化、模型產(chǎn)業(yè)化的趨勢,大家都開始進行深層次的思考。
在如今這個AI發(fā)展的關(guān)鍵節(jié)點,不論是機器人還是智能體,只有真正理解數(shù)據(jù)價值、提升數(shù)據(jù)利用率、突破模型的挑戰(zhàn),才能加快迎來真正的爆發(fā)式發(fā)展。當機器人能夠進入千家萬戶,當智能體能夠真正理解并完美執(zhí)行人們的指令,一切將會變得截然不同。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




