- +1
人工智能學(xué)者張崢:AI落地關(guān)鍵取決于業(yè)務(wù)數(shù)字化的可能性
近日,由中國(guó)建銀投資有限責(zé)任公司傾力打造的2020年度“JIC講堂·科技投資系列”第六場(chǎng)活動(dòng)在建投書(shū)局舉行。
本期活動(dòng)上,上海紐約大學(xué)計(jì)算機(jī)系終身教授、亞馬遜云服務(wù)上海人工智能研究院院長(zhǎng)張崢與《經(jīng)濟(jì)學(xué)人·商論》執(zhí)行總編輯吳晨二人,以“人工智能產(chǎn)業(yè)的未來(lái)與挑戰(zhàn)”為主題進(jìn)行了一場(chǎng)信息量巨大的對(duì)談。
談到目前人工智能已經(jīng)可以輔助人類進(jìn)行寫(xiě)作,張崢表示這是數(shù)據(jù)量大幅增加后“大力出奇跡”的結(jié)果。他表示,人工智能的應(yīng)用需要解決數(shù)據(jù)的獲取、數(shù)據(jù)的清洗與數(shù)據(jù)的洞察三方面的問(wèn)題。自動(dòng)駕駛是一個(gè)人工智能應(yīng)用非常好的場(chǎng)景,但它需要分場(chǎng)景、分階段落地。談到數(shù)據(jù)安全和隱私的理念,張崢則認(rèn)為,“原始粗暴的數(shù)據(jù)積累早日結(jié)束早日好”,并介紹了新的數(shù)據(jù)和隱私安全理念下“聯(lián)邦學(xué)習(xí)”的加密分布式學(xué)習(xí)技術(shù)。
人工智能寫(xiě)作是“大力出奇跡”的結(jié)果
吳晨介紹,《經(jīng)濟(jì)學(xué)人》有一個(gè)熊彼特專欄,有15年歷史約1000篇稿件,三年前編輯部做過(guò)一個(gè)實(shí)驗(yàn),把這1000篇稿件輸入機(jī)器,讓機(jī)器人去寫(xiě),但寫(xiě)出來(lái)的結(jié)果是每句話都像英文,連在一起不知道在說(shuō)什么。但三年以后的現(xiàn)在,機(jī)器人已經(jīng)能夠?qū)懗鱿駱拥母寮恕?/p>
對(duì)此,張崢表示,這是數(shù)據(jù)量大幅增加后“大力出奇跡”的結(jié)果。
“我們給機(jī)器喂了46個(gè)T的數(shù)據(jù),相當(dāng)于幾百個(gè)100G手機(jī)的容量,有1750億個(gè)參數(shù)要去慢慢調(diào)整?!睆垗槺硎荆斑@幾年人工智能在質(zhì)量方面確實(shí)有一定的飛躍,所以變得越來(lái)越像‘人話’”。
當(dāng)前計(jì)算機(jī)在寫(xiě)作上已經(jīng)能夠給予人類一定的輔助,但機(jī)器其實(shí)并不能理解人類用詞時(shí)的情感和意義。
以當(dāng)前各類應(yīng)用都會(huì)有的詞匯聯(lián)想功能為例,張崢舉例稱,一個(gè)《紐約客》的作者做了一個(gè)實(shí)驗(yàn),他在給兒子寫(xiě)一封郵件,寫(xiě)I'm very p..,其實(shí)他的原意是I'm very pleased,但機(jī)器給他的提示是I'm very proud。
“這比他本意要好多了——作為爸爸應(yīng)該為兒子感到自豪,而不能總是居高臨下。”張崢評(píng)論道,“但機(jī)器其實(shí)不知道是怎么回事,是人自己腦補(bǔ)做爸爸的做得不夠好?!?/p>
人工智能落地關(guān)鍵是業(yè)務(wù)數(shù)字化的可能
張崢表示,人工智能落地的關(guān)鍵是這個(gè)業(yè)務(wù)有沒(méi)有數(shù)字化的可能。
他具體介紹,人工智能的應(yīng)用需要解決數(shù)據(jù)的獲取、數(shù)據(jù)的清洗與數(shù)據(jù)的洞察三方面的問(wèn)題。人工智能是否能在產(chǎn)業(yè)中落地,首先要看產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型程度,一個(gè)產(chǎn)業(yè)如果已經(jīng)數(shù)字化并且大量地依靠數(shù)據(jù),人工智能才能更好地進(jìn)入。其次,產(chǎn)業(yè)數(shù)字化后,還需要注意對(duì)數(shù)據(jù)的清洗,因?yàn)楂@得的數(shù)據(jù)往往非常粗糙,“噪聲”很大。最后是解決對(duì)數(shù)據(jù)的洞察,如何從無(wú)結(jié)構(gòu)的數(shù)據(jù)中獲取結(jié)構(gòu),也是人工智能未來(lái)亟待解決的問(wèn)題。因此,較有發(fā)展前景的應(yīng)用領(lǐng)域應(yīng)該是實(shí)現(xiàn)了良好的數(shù)字化轉(zhuǎn)型,并能通過(guò)結(jié)構(gòu)化將數(shù)據(jù)轉(zhuǎn)化成生產(chǎn)力的領(lǐng)域。
談到自動(dòng)駕駛行業(yè)時(shí),張崢表示,自動(dòng)駕駛是一個(gè)人工智能應(yīng)用非常好的場(chǎng)景,但它需要分場(chǎng)景、分階段落地。
吳晨也表示,街上跑的車都變成自動(dòng)駕駛在3-5年內(nèi)是不現(xiàn)實(shí)的,但是在園區(qū)、高速公路、貨運(yùn)卡車這些領(lǐng)域可能會(huì)更快地看到變化。他介紹,“硬件領(lǐng)域一定有很多的投資機(jī)會(huì),所以會(huì)不斷有需求,但是真正組合起來(lái)到底會(huì)是什么樣新的商業(yè)場(chǎng)景,這中間存在很大的風(fēng)險(xiǎn)。”
談隱私:原始粗暴的數(shù)據(jù)積累應(yīng)盡早結(jié)束
數(shù)據(jù)對(duì)于人工智能發(fā)展的重要性毋庸置疑,吳晨引用李開(kāi)復(fù)的觀點(diǎn)稱,中國(guó)人工智能和大數(shù)據(jù)之所以在過(guò)去幾年這么快地發(fā)展,就是因?yàn)橹袊?guó)的數(shù)據(jù)無(wú)論從總量還是搜集渠道都比美國(guó)要多得多。
對(duì)此張崢表達(dá)了自己的看法,稱“原始粗暴的數(shù)據(jù)積累早日結(jié)束早日好,這是不能亂來(lái)的。我覺(jué)得保護(hù)隱私是大家的責(zé)任”。
吳晨提出,用戶在使用很多免費(fèi)服務(wù)的時(shí)候,實(shí)質(zhì)是拿自己的行為信息在換取某種便利的服務(wù),但這個(gè)數(shù)據(jù)到底應(yīng)該歸于誰(shuí),手機(jī)上的行為信息到底屬于這個(gè)App還是屬于用戶自己,這是中國(guó)、歐美都在探討的問(wèn)題。
歐洲《通用數(shù)據(jù)保護(hù)條例(GDPR)》專門提出了兩個(gè)重要的領(lǐng)域,一是數(shù)據(jù)的“可遷移性”(portability),如當(dāng)用戶不想使用某個(gè)社交網(wǎng)絡(luò)服務(wù)時(shí),可以把上面過(guò)去形成的所有數(shù)據(jù)都帶走。另一個(gè)是數(shù)據(jù)的“遺忘權(quán)”,就是過(guò)去在網(wǎng)上分享的內(nèi)容,不想再保留的話用戶可以將其刪除。
在這種數(shù)據(jù)安全的理念指導(dǎo)之下,張崢介紹了新興的“聯(lián)邦學(xué)習(xí)”(Federated Learning)技術(shù)。
聯(lián)邦學(xué)習(xí)是一種加密的分布式學(xué)習(xí)技術(shù),各個(gè)參與方可以在不披露底層數(shù)據(jù)和底層數(shù)據(jù)的加密(混淆)形態(tài)的前提下共建模型,適合訓(xùn)練數(shù)據(jù)涉及隱私敏感,和訓(xùn)練數(shù)據(jù)太大無(wú)法集中收集的情況。
張崢表示,聯(lián)邦學(xué)習(xí)的這種“模型與數(shù)據(jù)互相不信任,但是還可以達(dá)到某一種服務(wù)。這中間有一定的折衷,質(zhì)量可能要低一點(diǎn),但是換取了其他意義上的信任”。
“JIC講堂”是中國(guó)建投集團(tuán)調(diào)動(dòng)優(yōu)質(zhì)智力資源,以建投書(shū)局文化空間為前沿陣地,集合多方智慧和力量打造的高品質(zhì)講堂品牌?!癑IC講堂”自2016年以來(lái)共舉辦70余場(chǎng)深度對(duì)話和思想交流,向社會(huì)分享前瞻視野與專業(yè)洞察,提供理性分析與價(jià)值參考,擁有逾百位專家學(xué)者的思想智庫(kù),覆蓋國(guó)內(nèi)頂級(jí)高校和科研機(jī)構(gòu),受到學(xué)界、業(yè)界、公眾等多方人士的關(guān)注。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




