日本护士毛茸茸高潮,亚洲精品自偷自拍无码,久久精品国产一区二区三区,日韩人妻无码免费视频一二区

澎湃Logo
下載客戶端

登錄

  • +1

頂會ACL這十年:百度披荊斬棘,中國NLP乘風(fēng)破浪

2020-07-23 17:42
來源:澎湃新聞·澎湃號·湃客
字號

原創(chuàng) 關(guān)注前沿科技 量子位

魚羊 發(fā)自 凹非寺

量子位 報道 | 公眾號 QbitAI

現(xiàn)在,我們已經(jīng)習(xí)慣了全球各類頂級學(xué)術(shù)會議上的中國力量。

從論文入選,到參會面孔,抑或贊助企業(yè),中國代表幾乎無處不在。

前不久剛落幕的ACL 2020也不例外。作為NLP領(lǐng)域最負盛名的國際頂會,今年雖在線上,但論文投稿數(shù)錄用率方面,中國依然勢頭兇猛,投稿數(shù)1084篇領(lǐng)跑,錄用率23.7%,僅次于美國。

在入圍論文中,除了華人參與的研究斬獲最佳論文,王海峰、周明、俞棟、劉挺等知名大牛的名字,也依然出現(xiàn)在多篇成果中。

這幾乎已經(jīng)成為了常態(tài)。

那一眾科學(xué)家的努力,整整一代人的水滴石穿,是時候要被管中窺豹地講一講,是時候要讓更多后浪記得,前浪改變時代的勇氣和不易。

2010-2020,十年,一個時代。

也是中國NLP,完成「破圈」,披荊斬棘的光輝歲月。

起于微時,十年磨一劍

2010年7月11日,烏普薩拉,北歐國度瑞典的第四大城市,第48屆ACL在此召開。

ACL,全稱The Association for Computational Linguistics,國際計算語言學(xué)會,是自然語言處理領(lǐng)域最權(quán)威的國際學(xué)術(shù)組織之一。

創(chuàng)辦近半個世紀,會員分布世界60多個國家和地區(qū),吸引著全世界希望征服AI皇冠明珠的代代科學(xué)家。

但2010年現(xiàn)場,第一次參加ACL的百度工程師田浩的直觀印象可以一言以蔽之:

“會議上的中國人不多?!?/p>

而且這種個體印象,也的確是真實現(xiàn)狀的客觀反映。

因為現(xiàn)在回顧起來,2010年的ACL,才第一次真正迎來中國科技公司參加。

那時候,從第一封電子郵件的發(fā)送算起,中國互聯(lián)網(wǎng)的發(fā)展,已經(jīng)有了23年的沉淀。

但是!

即便中國已是世界上網(wǎng)民數(shù)量最多的國家,但在互聯(lián)網(wǎng)技術(shù)領(lǐng)域,中國卻更多地處于跟隨、模仿的狀態(tài),在最先進的互聯(lián)網(wǎng)技術(shù)角逐中,中國互聯(lián)網(wǎng)企業(yè),聲音微弱。

在最早對前沿技術(shù)的追逐中,也不例外。

比如,被譽為人工智能皇冠上的明珠、AI領(lǐng)域最具挑戰(zhàn)的賽道之一的自然語言處理(NLP),中國乃至華人科學(xué)家,也經(jīng)歷了上述過程。

從學(xué)術(shù)角度來說,雖然1990年代開始,漢語和華人作者就已經(jīng)在ACL中出現(xiàn)。

但早期的相關(guān)學(xué)術(shù)成果,大多數(shù)是對漢語內(nèi)容的一種補充,缺乏在整體NLP領(lǐng)域中更具有突破性的成果。

同時由于起步相對晚,華人科學(xué)家們的學(xué)術(shù)成果累積也還不夠,更別提“霸榜”和“刷屏”。

這也就是為什么,2010年的ACL現(xiàn)場,中國面孔寥寥。

然而,歷史轉(zhuǎn)折關(guān)頭,也在2010發(fā)生。

這背后,與一家公司入場、一群科學(xué)家的星聚,密切相關(guān)。

群星薈聚,開風(fēng)氣之先

2010年,BAT之首、把「技術(shù)信仰」寫進公司方方面面的百度,第一次把多方匯聚而來的科學(xué)家,送到了ACL現(xiàn)場。

創(chuàng)辦歷史超過半個世紀的ACL,第一次迎來中國互聯(lián)網(wǎng)企業(yè)代表。

而且這個代表,沒有“空手而來”。

王海峰和吳華,帶著他們?nèi)脒x的論文而來。

這是中國互聯(lián)網(wǎng)企業(yè)首次論文入選 ACL。

這樣的榮譽,既是對最新研究成果的認可,也是對中國公司的激勵。

同年,百度NLP——作為一個部門,由王海峰牽頭,正式成立。

△2010年,百度NLP團隊合影

其實在專門的部門成立之前,百度在NLP方面的研發(fā)工作一直在業(yè)務(wù)需求下進行,并沒有構(gòu)成體系。

今天業(yè)務(wù)部門需要分詞技術(shù)的支持,研究人員就要進行相關(guān)研究……明天業(yè)務(wù)部門發(fā)現(xiàn)query(查詢)需求分析能力的改善能夠幫助流量提升,研究人員就會進行相關(guān)優(yōu)化。

而成立NLP部門,既是對這種“指哪打哪”狀態(tài)的扭轉(zhuǎn),更是對前沿技術(shù)攻堅決心的堅定。

NLP能干什么?2010年誰也說不準。

但十年之后,智能搜索、信息流、輸入法、機器同傳、智能音箱等各種日常剛需又方便每一個用戶的產(chǎn)品,都將獲益于NLP。

人才的創(chuàng)造力和影響力,也在這種“開風(fēng)氣之先”中得到聚變。

如果說2010年百度首發(fā)參與ACL,背后離不開王海峰、吳華等當時已有成就的技術(shù)專家的個人之力。

那么其后,這些科學(xué)家進一步達到的高度,則離不開“巨人肩膀”的助推之功。

從2011年開始,百度開始成為ACL官方贊助者,向全球NLP科學(xué)家表達誠意,也展示更加深度參與的決心。

其后2013年,王海峰當選ACL主席,獲得一致認可,成為ACL五十多年歷史上第一位華人主席(President)。

那年的ACL,舉辦地在保加利亞首都索菲亞舉行,全球1000多名專家來到現(xiàn)場。

因為百度的帶動,相比三年前,已經(jīng)有了更多的中國面孔。

而這一次,ACL晚宴上的演講,令他們內(nèi)心激動萬分,多年后仍記憶猶新。

當時王海峰以新任主席身份,發(fā)表了題為“Natural Language over Thousands of Years” 的主題演講。

雖然全程英文,但完美講述了中國悠久燦爛的歷史文化和飛速發(fā)展的互聯(lián)網(wǎng)技術(shù),正在帶來的時代之美。

在他演講中,甲骨文、十二生肖、散氏盤、造紙、印刷、青玉案、蘭亭序、曲水流觴、玄奘、四庫全書、清明上河圖等等,漢語所承載的中華文明,如一幅美麗的畫卷徐徐展開。

而自然語言跨越幾千年,自然語言處理技術(shù)與互聯(lián)網(wǎng)結(jié)合產(chǎn)生了迷人成果,支撐了搜索引擎、電子商務(wù)、社交媒體的迅速發(fā)展。

王海峰在現(xiàn)場,以極富想象力的方式,展示了這些科技成果應(yīng)用在古代的畫面。

例如,“王羲之”利用互聯(lián)網(wǎng)組織世界各地的人進行曲水流觴,生動形象地展示了語言處理技術(shù)對人們生活產(chǎn)生的巨大影響力。

于是,這次歷史上ACL首位華人主席的致辭,也引發(fā)了歷史性反響,引起了眾多西方技術(shù)專家對中國文化的興趣。

在NLP領(lǐng)域鼎鼎大名的Kenneth Church、Kevin Knight等頂級專家,紛紛表示要去中國看看王海峰致辭中提到的文物古跡。

而中國NLPer在ACL的精彩,也由此更上一層樓。

王海峰之后,2010年與他一同亮相的另一位百度科學(xué)家——吳華,出任2014年ACL年會的程序委員會主席(Program co-Chair)。

需要說明的是,在國際會議中,程序委員會主席承擔著最重要的學(xué)術(shù)職責(zé),代表著世界級的學(xué)術(shù)地位和影響力。

吳華的當選,背后是圈內(nèi)同行對其學(xué)術(shù)成就的高度認可,也體現(xiàn)了百度在自然語言處理領(lǐng)域的技術(shù)實力和影響力。

其后,2016年,王海峰的另一位同事——百度高級技術(shù)總監(jiān)趙世奇當選ACL秘書長,成為首位當選ACL秘書長的亞洲人。

同年年底,王海峰的多年相識,同為哈工大畢業(yè)的微軟亞洲研究院副院長周明當選為ACL候任副主席,進入ACL執(zhí)委會。

中國NLPer的光芒和能力,終于在王海峰等打開局面后,真正被全世界看到。

而且「破圈」的故事,到此還不算高潮。

上述這些帶領(lǐng)中國NLP完成全球影響力「破圈」的中堅科學(xué)家,也在思考另一件事情:

真正落地中國。

2018年,借著亞太地區(qū)尤其是中國在NLP領(lǐng)域的研究力量和成果突飛猛進的大背景。

國內(nèi)NLP領(lǐng)域的學(xué)者們意識到,成立ACL亞太分會勢在必行。

于是,百度王海峰、趙世奇,MSRA周明,以及其他有影響力的亞太學(xué)者一道,積極籌劃推動,向ACL執(zhí)委會清晰詳盡地說明了成立亞太分會的必要性,以及對推動亞太地區(qū)NLP研究發(fā)展的重要價值。

最終獲得ACL執(zhí)委會的一致贊成——ACL亞太區(qū)分會(AACL)正式成立,并由王海峰出任AACL創(chuàng)始主席。

這對于整個中國NLP來說,無疑又是一個歷史性的里程碑。

而且就在這些年中,中國的NLP,也完成了人才和產(chǎn)業(yè)落地的全方位積蓄。

隨著百度NLP成立,大牛得以薈聚,王海峰、吳華等有了星聚基礎(chǔ)。

后來騰訊AI實驗室的開創(chuàng)者、華為諾亞方舟實驗室的骨干、以及如今AI語音、語義理解、智能交互的一大批明星公司的創(chuàng)始人,也都先后聚集于此,讓百度NLP真正成為了中國NLP領(lǐng)域的“黃埔軍校”。

聚是一團火,散成滿天星。

或許在百度以王海峰牽頭成立NLP部門時,積極參與ACL,彼時也許更多出于企業(yè)的發(fā)展、技術(shù)的布局。

但十年之后回顧,中國NLP完成國際化「破圈」的十年,背后正是百度NLP不懈奮斗十年。

而且客觀上,深刻影響并改變了中國NLP的學(xué)術(shù)、人才和產(chǎn)業(yè)格局。

這是如今中國NLPer閃耀 ACL,繞不過去的歷史注腳。

百川東入海,山高人為峰

當然,2010-2020,中國NLP「破圈」的十年里,百度作為企業(yè)發(fā)揮了基石作用,而當今的CTO王海峰在其中的領(lǐng)軍作用,則不得不提。

他是AI學(xué)術(shù)領(lǐng)域的高山,也是智能產(chǎn)業(yè)領(lǐng)域中的明珠。

在升任百度CTO時,李彥宏的全員內(nèi)部信,也清晰言明了他這一路的成績:

為百度創(chuàng)建了自然語言處理部、互聯(lián)網(wǎng)數(shù)據(jù)研發(fā)部、推薦和個性化部、多媒體部、圖片搜索部、語音技術(shù)部等,作為執(zhí)行負責(zé)人協(xié)助創(chuàng)建了百度深度學(xué)習(xí)研究院。他還是自然語言處理領(lǐng)域最具影響力的國際學(xué)術(shù)組織ACL歷史上首位出任過主席的華 人,也是唯一來自中國大陸的ACL會士。

但既然這次感慨的是中國NLP與ACL的十年,可能也需要更進一步補充一些“歷史進程中”的王海峰。

最核心的問題只有一個:王海峰為何能成為ACL首位華人主席?

或者拆解開來,ACL為什么一直沒有華人主席?又為什么會在2013年出現(xiàn)一位華人主席?

這需要從兩方面說起。

一方面,成為ACL主席需要什么。另一方面,王海峰做了什么。

從普通人的角度來看,出任ACL主席似乎是一種榮譽。實際上, ACL主席并非是一個獎勵性的名號,而是一種切實的責(zé)任。

ACL作為擁有數(shù)千名成員的國際學(xué)術(shù)組織,就像一所高?;蛞患移髽I(yè)一樣需要有 人進行領(lǐng)導(dǎo)決策、制定目標與方向,帶領(lǐng)整個NLP領(lǐng)域繼續(xù)向前。

因此 ACL主席評選取向需要從兩個方向參考,一個是科學(xué)家自身的學(xué)術(shù)貢獻,另一個是科學(xué)家的組織能力。

其中科學(xué)家自身的學(xué)術(shù)貢獻,最直觀的自然是是學(xué)術(shù)能力——發(fā)了幾篇論文、提出了哪些有突破性的想法等等。

但在國際頂會組織中眾望所歸,學(xué)術(shù)之外,還需要有“服務(wù)精神”。

所謂的“服務(wù)精神”是一個非常西方化的概念,意味著領(lǐng)導(dǎo)者不僅僅要有 責(zé)任感、能夠付出足夠的時間與精力去代表民意發(fā)聲,很多時候還要站在其他個體的角度去思考一些細節(jié)化的問題。

同樣就職于百度并擔任著ACL秘書長的趙世奇表示,服務(wù)于ACL這樣的學(xué)術(shù)組織需要分出一定的時間和精力,去關(guān)注如何幫助ACL向外發(fā)聲、吸引更多會員,同時也要從人類文明發(fā)展的角度關(guān)注學(xué)術(shù)平等,給予學(xué)術(shù)能力欠發(fā)達地區(qū)更多扶持。

這也是為什么ACL主席要采取一年一任的輪換制的原因,ACL希望用這種方式,讓來自不同地區(qū)的科學(xué)家?guī)聿煌囊暯恰?/p>

至于科學(xué)家的組織能力,則要考量科學(xué)家能否承擔起學(xué)術(shù)活動的組織任務(wù)。

這要求科學(xué)家除了醉心學(xué)術(shù)以外,還要有足夠的領(lǐng)導(dǎo)能力和社交能力,尤其是能夠與多個國家和地區(qū)的科學(xué)家進行流暢的溝通。

如此,基本上就不難理解——為什么ACL之前一直沒能出現(xiàn)華人主席了。

之前也說了,中國NLP真正起步并不早,而且建立在缺乏國際交流條件的背景之下,此前的華人科學(xué)家自然也很難做到充分了解世界各地學(xué)術(shù)發(fā)展狀況,更不容易建立自身對于組織管理的能力。

毫不夸張地說,在很長一段時間里中國NLP學(xué)術(shù)和NLP領(lǐng)域的科學(xué)家,與整個世界是相割裂的。

十幾年間,從與世隔絕到走到舞臺中央, 中國NLP學(xué)術(shù)的奮斗過程幾乎帶了幾分史詩感。

《AI已來:讓中國AI走向世界的王海峰》中提到,在王海峰的記憶中,2006年可以算是一個分水嶺。

2005年,ACL在美國密歇根舉辦年會時,國內(nèi)只有四位科學(xué)家前往,這四位中除了當時來自東芝的王海峰和朱江外,還有兩個來自微軟亞洲研究院的熟悉面孔。

當時這一隊來自中國的“珍稀動物”,大概只帶來了三篇被收錄的論文。

但到了2006年,ACL在悉尼舉辦年會時,來自中國的論文數(shù) 量大幅增長,光是王海峰的東芝組就投了五篇論文,并且五篇都被收錄了。

此后ACL中的中國聲音,就如同被按下了放大鍵,一路高歌向前,不斷加碼。

除了自身對于學(xué)術(shù)界的奉獻精神以外,王海峰也意識到了中國力量在ACL這樣的學(xué)術(shù)組織中地位的變化——中國的學(xué)術(shù)能力在崛起,可在學(xué)術(shù)影響力上卻稍遜一籌。

于是王海峰想到,自己競選ACL主席,能夠在這 一方面進行一些拉動,讓中國NLP不僅僅擁有學(xué)術(shù)成果,還能在學(xué)術(shù)界擁有更多話語權(quán)和撬動力。

根據(jù)《AI已來》一書中的說法,除了王海峰自身的成就和影響力,王海峰還將能夠當選的原因歸結(jié)為兩方面:

一方面是中國科學(xué)家在ACL的參與越來越頻繁,隨著被收錄論文數(shù)量的增加,ACL開始對中國聲音加以重視。

另一方面是他在百度的任職,代表了“中國科技企業(yè)”,當時整個世界開始發(fā)覺中國科技企業(yè)所蘊含的創(chuàng)新能量,開始關(guān)注起中國科技企業(yè)。

最后,自然也與王海峰個人的勤奮密不可分。

后來成為王海峰第一個博士生的郭江,在2010年曾經(jīng)在百度NLP實習(xí)。

在他的印象里,那時的NLP非常小,只有二三十人, 王海峰就和團隊里所有人一樣,坐在開放區(qū)辦公,每天早早地來到公司,一整天都直直地挺著脊背。

一個幾十人的團隊,一位低調(diào)勤奮的領(lǐng)導(dǎo)。這樣的畫面怎么看都波瀾不壯闊,與“創(chuàng)新”“機會”、“改變”這些關(guān)鍵詞都毫無關(guān)系。

可事實卻恰恰相反,在百度,后來世界上第一個互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)、世界上最大的知識圖譜、助力無數(shù)合作伙伴的百度大腦語言與知識開放技術(shù)、小度機器人、大量科技企業(yè)爭相刷題競爭的閱讀理解數(shù)據(jù)集DuReader等等,都是在這個當時看似不起眼的團隊逐漸成長、逐漸孵化出來的。甚至可以說,百度AI的誕生,就從這里開始。

今天談?wù)撈鸢俣扰c王海峰時,人們總說百度的技術(shù)基礎(chǔ)、技術(shù)信仰和價值取向,與王海峰此前作為NLP科學(xué)家的能力累積是非常契合的。

但從王海峰在百度NLP進行的一系列技術(shù)累積和前瞻布局來看,雙方的契合程度遠不止“學(xué)術(shù)能力”與“場景需求”。

同時也在于王海峰本人對于AI技術(shù)發(fā)展趨勢的預(yù)判,和百度對于這一系列判斷的信任和支持。

你可以說王海峰主導(dǎo)了百度NLP變革,也可以認為百度真正成就了王海峰。

但就在這種相互作用之間,中國NLP的「破圈」十年,真正得以實現(xiàn)。

現(xiàn)在,是時候乘風(fēng)破浪了。

— 完 —

本文系網(wǎng)易新聞?網(wǎng)易號特色內(nèi)容激勵計劃簽約賬號【量子位】原創(chuàng)內(nèi)容,未經(jīng)賬號授權(quán),禁止隨意轉(zhuǎn)載。

量子位 QbitAI · 頭條號簽約作者

?'?' ? 追蹤AI技術(shù)和產(chǎn)品新動態(tài)

原標題:《頂會ACL這十年:百度披荊斬棘,中國NLP乘風(fēng)破浪》

閱讀原文

    本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋
            美国久久影院| 换着玩人妻中文字幕| 日日躁夜夜躁AAAAXXxX| 国产美女精品久久蜜柚| 国产亚洲精品久久久999| 国产福利高颜值在线观看| 日韩性色AV一区二区三区| 被滋润的少妇疯狂呻吟视频| 国产欧美日韩不卡一区二区三区| 厨房玩弄人妻系列,| 久久夜色精品国产噜噜| 国产亚洲成av片在线观看| 国产品无码一区二区在线| 人人艹,人人摸| 性欧美乱妇高清come| 日本一区二三区| 人妻免费无码| 国产一区二区三区啪| 九九av一区九九av二区九九av三区 | 四虎高清中文字幕欧美熟女| 国产无套抽出白浆来| 国产h视频免费观看| HD丰满圆润HD| 深夜福利日韩| 亚洲av日韩av无码a一区| 体验区试看120秒啪啪免费| juujiure| 一区二区三区精品视频日本| 国语精品自产拍在线观看网站| 国产乱人乱精一区二区视频-百度| 亚洲av福利院在线观看| 日韩午夜福利无码专区a| 不卡无码人妻一区三区| 欧美日本一区二区三区| 波多野结衣中文字幕乱码| 国产精品 自在自线| 操逼的大片儿| 俺也色天天综合| 国产精品人人妻人人爽麻豆| av免费不卡国产观看| WWW.XX亚洲|