- +1
第十五期北京大學(xué)可視化發(fā)展前沿研究生暑期學(xué)校第八講:歷史可視化與標(biāo)注利用
7月12日上午,第十五期北京大學(xué)可視化發(fā)展前沿研究生暑期學(xué)校系列線下課程中,華為軟件創(chuàng)新實(shí)驗(yàn)室張宇老師為同學(xué)們帶來了專題講座:歷史可視化與標(biāo)注利用。

數(shù)據(jù)可視化歷史
背景: 前計(jì)算機(jī)時(shí)代的數(shù)據(jù)可視化
講座一開始,張宇老師介紹了幾幅經(jīng)典的前計(jì)算機(jī)時(shí)代的可視化作品作為引子,包括John Snow的霍亂地圖、Charles Minard的拿破侖東征圖、William Playfair的小麥價(jià)格和工資圖、Jacques Bertillon的專題地圖。這些作品至今仍是可視化工作者學(xué)習(xí)的對(duì)象。
張宇老師由此引出了以下問題:有多少前計(jì)算機(jī)時(shí)代的可視化流傳至今?歷史上的可視化使用過哪些設(shè)計(jì)?我們可以如何利用前計(jì)算機(jī)時(shí)代的可視化?這一次講座將依次回答這三個(gè)問題。

背景:前計(jì)算機(jī)時(shí)代的數(shù)據(jù)可視化
有多少前計(jì)算機(jī)時(shí)代的可視化流傳至今
想要弄清這個(gè)問題需要明確前計(jì)算機(jī)時(shí)代可視化作品的數(shù)據(jù)收集方法。張老師首先排除了圖片搜索引擎,因?yàn)檫@類來源缺乏元數(shù)據(jù),收集到的數(shù)據(jù)還需要去重。更合理的辦法是從各類數(shù)字圖書館提取圖片,方便獲得書目信息、圖片文件屬性和版權(quán)信息等元數(shù)據(jù)。他從中提取了37萬張電子圖書館中的圖像及相應(yīng)元數(shù)據(jù)。而后人工對(duì)這些圖片進(jìn)行標(biāo)注,用VGG-16行文本/地圖/可視化檢測,篩選出34.5萬余張圖像的標(biāo)簽 。進(jìn)行標(biāo)注質(zhì)檢與糾錯(cuò)后,按出版日期過濾可視化圖像,最后得到了1.3萬張前計(jì)算機(jī)時(shí)代的可視化圖像及相應(yīng)元數(shù)據(jù)。這一步研究的成果以線上畫廊(https://github.com/oldvis/gallery)的形式呈現(xiàn)。

OldVis項(xiàng)目軟件棧

OldVis項(xiàng)目標(biāo)注系統(tǒng)

線上畫廊
歷史上的可視化使用過哪些設(shè)計(jì)?
張宇老師在上一步研究的基礎(chǔ)上,用設(shè)計(jì)方法對(duì)前計(jì)算機(jī)時(shí)代的可視化作品進(jìn)行了層次分類。這一步研究需要利用VisTaxa對(duì)圖片標(biāo)簽進(jìn)行大量編碼工作,包括創(chuàng)建和編輯分類、解決結(jié)構(gòu)沖突、修改標(biāo)簽以及解決標(biāo)簽沖突的一套完整流程。在進(jìn)行這一步研究時(shí),包括張老師在內(nèi)的3個(gè)編碼者一起工作,每次迭代中編碼100張圖片,最后建立了51個(gè)分類單元。

VisTaxa系統(tǒng)
我們可以如何利用前計(jì)算機(jī)時(shí)代的可視化?
首先,收集前計(jì)算機(jī)時(shí)代的可視化作品可以作為二次設(shè)計(jì)的靈感來源,比如現(xiàn)代工作者可以在舊有作品上增加交互和提升擴(kuò)展性。
其次,還可以進(jìn)行一些衍生研究,比如回答這兩個(gè)問題:誰是最高產(chǎn)的作者?高產(chǎn)的作者為什么高產(chǎn)?張老師發(fā)現(xiàn)前計(jì)算機(jī)時(shí)代的高產(chǎn)工作者往往是政府的1統(tǒng)計(jì)工作者,他們具有時(shí)間、數(shù)據(jù)和出版等方面的便利。
再次,這些前計(jì)算機(jī)時(shí)代的作品還可以用來提取歷史數(shù)據(jù),比如從John Snow的霍亂地圖中可以提取出倫敦瘟疫的史料。
復(fù)次,歷史圖像往往不是孤立存在的,而是有前后繼承的譜系,收集工作有利于圖像的版本研究。
總結(jié)
張宇老師的研究不僅對(duì)于理解可視化工作的前史和經(jīng)驗(yàn)積累有重要意義,也對(duì)歷史研究者搜集史料提供了便利。本次講座詳細(xì)拆解了這一研究的過程和工具,對(duì)于同學(xué)們進(jìn)行自己的研究具有方法論和研究邏輯上的借鑒意義。
原標(biāo)題:《第十五期北京大學(xué)可視化發(fā)展前沿研究生暑期學(xué)校第八講-歷史可視化與標(biāo)注利用-張宇》
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場,澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




