- +1
人工智能學者張崢:AI落地關(guān)鍵取決于業(yè)務數(shù)字化的可能性
近日,由中國建銀投資有限責任公司傾力打造的2020年度“JIC講堂·科技投資系列”第六場活動在建投書局舉行。
本期活動上,上海紐約大學計算機系終身教授、亞馬遜云服務上海人工智能研究院院長張崢與《經(jīng)濟學人·商論》執(zhí)行總編輯吳晨二人,以“人工智能產(chǎn)業(yè)的未來與挑戰(zhàn)”為主題進行了一場信息量巨大的對談。
談到目前人工智能已經(jīng)可以輔助人類進行寫作,張崢表示這是數(shù)據(jù)量大幅增加后“大力出奇跡”的結(jié)果。他表示,人工智能的應用需要解決數(shù)據(jù)的獲取、數(shù)據(jù)的清洗與數(shù)據(jù)的洞察三方面的問題。自動駕駛是一個人工智能應用非常好的場景,但它需要分場景、分階段落地。談到數(shù)據(jù)安全和隱私的理念,張崢則認為,“原始粗暴的數(shù)據(jù)積累早日結(jié)束早日好”,并介紹了新的數(shù)據(jù)和隱私安全理念下“聯(lián)邦學習”的加密分布式學習技術(shù)。
人工智能寫作是“大力出奇跡”的結(jié)果
吳晨介紹,《經(jīng)濟學人》有一個熊彼特專欄,有15年歷史約1000篇稿件,三年前編輯部做過一個實驗,把這1000篇稿件輸入機器,讓機器人去寫,但寫出來的結(jié)果是每句話都像英文,連在一起不知道在說什么。但三年以后的現(xiàn)在,機器人已經(jīng)能夠?qū)懗鱿駱拥母寮恕?/p>
對此,張崢表示,這是數(shù)據(jù)量大幅增加后“大力出奇跡”的結(jié)果。
“我們給機器喂了46個T的數(shù)據(jù),相當于幾百個100G手機的容量,有1750億個參數(shù)要去慢慢調(diào)整?!睆垗槺硎荆斑@幾年人工智能在質(zhì)量方面確實有一定的飛躍,所以變得越來越像‘人話’”。
當前計算機在寫作上已經(jīng)能夠給予人類一定的輔助,但機器其實并不能理解人類用詞時的情感和意義。
以當前各類應用都會有的詞匯聯(lián)想功能為例,張崢舉例稱,一個《紐約客》的作者做了一個實驗,他在給兒子寫一封郵件,寫I'm very p..,其實他的原意是I'm very pleased,但機器給他的提示是I'm very proud。
“這比他本意要好多了——作為爸爸應該為兒子感到自豪,而不能總是居高臨下。”張崢評論道,“但機器其實不知道是怎么回事,是人自己腦補做爸爸的做得不夠好。”
人工智能落地關(guān)鍵是業(yè)務數(shù)字化的可能
張崢表示,人工智能落地的關(guān)鍵是這個業(yè)務有沒有數(shù)字化的可能。
他具體介紹,人工智能的應用需要解決數(shù)據(jù)的獲取、數(shù)據(jù)的清洗與數(shù)據(jù)的洞察三方面的問題。人工智能是否能在產(chǎn)業(yè)中落地,首先要看產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型程度,一個產(chǎn)業(yè)如果已經(jīng)數(shù)字化并且大量地依靠數(shù)據(jù),人工智能才能更好地進入。其次,產(chǎn)業(yè)數(shù)字化后,還需要注意對數(shù)據(jù)的清洗,因為獲得的數(shù)據(jù)往往非常粗糙,“噪聲”很大。最后是解決對數(shù)據(jù)的洞察,如何從無結(jié)構(gòu)的數(shù)據(jù)中獲取結(jié)構(gòu),也是人工智能未來亟待解決的問題。因此,較有發(fā)展前景的應用領域應該是實現(xiàn)了良好的數(shù)字化轉(zhuǎn)型,并能通過結(jié)構(gòu)化將數(shù)據(jù)轉(zhuǎn)化成生產(chǎn)力的領域。
談到自動駕駛行業(yè)時,張崢表示,自動駕駛是一個人工智能應用非常好的場景,但它需要分場景、分階段落地。
吳晨也表示,街上跑的車都變成自動駕駛在3-5年內(nèi)是不現(xiàn)實的,但是在園區(qū)、高速公路、貨運卡車這些領域可能會更快地看到變化。他介紹,“硬件領域一定有很多的投資機會,所以會不斷有需求,但是真正組合起來到底會是什么樣新的商業(yè)場景,這中間存在很大的風險?!?/p>
談隱私:原始粗暴的數(shù)據(jù)積累應盡早結(jié)束
數(shù)據(jù)對于人工智能發(fā)展的重要性毋庸置疑,吳晨引用李開復的觀點稱,中國人工智能和大數(shù)據(jù)之所以在過去幾年這么快地發(fā)展,就是因為中國的數(shù)據(jù)無論從總量還是搜集渠道都比美國要多得多。
對此張崢表達了自己的看法,稱“原始粗暴的數(shù)據(jù)積累早日結(jié)束早日好,這是不能亂來的。我覺得保護隱私是大家的責任”。
吳晨提出,用戶在使用很多免費服務的時候,實質(zhì)是拿自己的行為信息在換取某種便利的服務,但這個數(shù)據(jù)到底應該歸于誰,手機上的行為信息到底屬于這個App還是屬于用戶自己,這是中國、歐美都在探討的問題。
歐洲《通用數(shù)據(jù)保護條例(GDPR)》專門提出了兩個重要的領域,一是數(shù)據(jù)的“可遷移性”(portability),如當用戶不想使用某個社交網(wǎng)絡服務時,可以把上面過去形成的所有數(shù)據(jù)都帶走。另一個是數(shù)據(jù)的“遺忘權(quán)”,就是過去在網(wǎng)上分享的內(nèi)容,不想再保留的話用戶可以將其刪除。
在這種數(shù)據(jù)安全的理念指導之下,張崢介紹了新興的“聯(lián)邦學習”(Federated Learning)技術(shù)。
聯(lián)邦學習是一種加密的分布式學習技術(shù),各個參與方可以在不披露底層數(shù)據(jù)和底層數(shù)據(jù)的加密(混淆)形態(tài)的前提下共建模型,適合訓練數(shù)據(jù)涉及隱私敏感,和訓練數(shù)據(jù)太大無法集中收集的情況。
張崢表示,聯(lián)邦學習的這種“模型與數(shù)據(jù)互相不信任,但是還可以達到某一種服務。這中間有一定的折衷,質(zhì)量可能要低一點,但是換取了其他意義上的信任”。
“JIC講堂”是中國建投集團調(diào)動優(yōu)質(zhì)智力資源,以建投書局文化空間為前沿陣地,集合多方智慧和力量打造的高品質(zhì)講堂品牌。“JIC講堂”自2016年以來共舉辦70余場深度對話和思想交流,向社會分享前瞻視野與專業(yè)洞察,提供理性分析與價值參考,擁有逾百位專家學者的思想智庫,覆蓋國內(nèi)頂級高校和科研機構(gòu),受到學界、業(yè)界、公眾等多方人士的關(guān)注。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




