- +1
馬忠文丨史料不止是數(shù)據(jù)

《近代史資料》總151號
大數(shù)據(jù)時代被納入各類數(shù)據(jù)庫的史料不知凡幾。面對洶涌而來的資料大潮,史學(xué)工作者無不眼花繚亂,疲于應(yīng)付,這已經(jīng)變得常態(tài)化了。在共享史料“爆炸”帶來的紅利時,研究者也會陷入無以自拔的痛苦中。一方面,史料的拓展為研究帶來了契機和動力;同時,如何把控海量的資料,進行扎實有效的研究,也變得十分棘手。一個明顯的傾向是史料很容易被“數(shù)據(jù)化”——正在以“數(shù)據(jù)”或“大數(shù)據(jù)”的形式呈現(xiàn)在史學(xué)工作者面前,被當(dāng)作“數(shù)據(jù)”來處理。這種現(xiàn)象需要引起學(xué)界的注意和思考。
一、史料的無限拓展與有效“占有”
史料是史學(xué)研究的基礎(chǔ)。從理論上說,各種史料都是片段的、瑣碎的,反映的都是歷史過程的不同側(cè)面,都有一定的局限性;而且,史料也是源源不斷被發(fā)掘出來的。當(dāng)下史學(xué)研究在梳理學(xué)術(shù)史的時候,更多關(guān)注的是觀點的演化和異同,卻很少注意到圍繞某個領(lǐng)域或主題的史料,其實也有一個不斷積累、更新的過程。史學(xué)的進步,除了研究視角的變換,材料的推陳出新,往往發(fā)揮著主導(dǎo)性作用。換句話說,新材料的發(fā)現(xiàn)永遠(yuǎn)在路上,史料是不可能窮盡的。
前輩學(xué)人也有曾有過對史料“竭澤而漁”的理想。談及古典學(xué)和一些冷門絕學(xué),人們常常會認(rèn)為可以“窮盡”材料,這是因為相關(guān)研究留存下來的文獻有限,勤勉的學(xué)者基本上可以做到了如指掌,說“竭澤”也有一定道理。不過,從長時間動態(tài)的觀察來分析,再“冷”再“絕”的學(xué)問,都會有新材料不斷出現(xiàn)。即使沒有新文獻的披露,實物與考古資料的不斷發(fā)現(xiàn),也會推動古史研究的進步??梢?,具體到每一位學(xué)者,以個人之力永遠(yuǎn)不可能真正“全面”地掌握材料。比較而言,古人占有史料的“全”與“不全”與當(dāng)時媒介、信息交流的發(fā)達程度有相當(dāng)?shù)年P(guān)系。因為信息交流的原因,前賢無法見到同時代其他學(xué)人集藏資料的情況司空見慣,在古籍版本研究中,近代以來不見于歷代藏書大家著錄的宋元珍本偶爾仍會現(xiàn)身,便是明證。
邁入大數(shù)據(jù)時代后,情況大為不同了。史料的發(fā)掘、交流、共享實現(xiàn)了革命性的突破。數(shù)據(jù)庫和各種檢索方式很大程度改變了材料的搜集效率和范圍。大量舊有已刊文獻的數(shù)字化,未刊文獻在新技術(shù)加持下的涌現(xiàn),以及網(wǎng)絡(luò)傳輸?shù)母咚俦憬?,最短時間內(nèi)就實現(xiàn)了史料海量匯聚與密集性呈現(xiàn),這是傳統(tǒng)史學(xué)研究無法企及的。

馬忠文《晚清日記書信考釋》
不過,即便如此,也不能說史料已經(jīng)到了可以“窮盡”的時代。史料雖鋪天蓋地涌來,研究者大可不必被這番聲勢所懾服。應(yīng)該堅信,我們面臨的問題的不是能不能“全部占有”史料,而是占有哪些史料?只要研究是由個人來完成的,占有“全部”史料就不可能。史料的“足”與“不足”本來就是相對的。通常所說的“詳盡占有”,不是指搜集材料的數(shù)量和范圍,應(yīng)是針對具體研究中最基礎(chǔ)、最核心的那些史料而言的,當(dāng)然也包括最新發(fā)現(xiàn)的有價值的材料。
關(guān)于這個問題,筆者認(rèn)為有兩點值得注意。首先,數(shù)字時代材料的膨脹有些“魚龍混雜”,新材料的披露、舊材料的重新組合、材料的重復(fù)等情況交織在一起,給研究帶來不少煩惱和困惑。研究者必須花費大量時間和精力去做史料的篩選,資料越多,鑒別與研究的難度反而更大。其次,新發(fā)現(xiàn)的資料是否有價值,只能在對已有史料熟悉把握基礎(chǔ)上才能作出判斷和取舍。說到底,面對海量史料,掌握真正對某項研究最基礎(chǔ)和最核心的材料,至為關(guān)鍵。反之,沒有扎實的研究積累和敏銳的學(xué)術(shù)判斷力,也很難確定哪些新材料對自己的研究真正有用。
在數(shù)字技術(shù)飛速發(fā)展的今天,掃描、影印、出版檔案、稿本等未刊資料,很受學(xué)界關(guān)注。不少數(shù)據(jù)庫都以收入“未刊”史料,來突出其價值之獨特性??梢姡纯Y料往往是以“新史料”的面目出現(xiàn)的。不過,這個問題也要從兩方面來看。未刊史料的披露,肯定是“史料”的增量因素,其積極意義必須肯定。但也不能武斷地認(rèn)為,未曾刊過就一定有重要價值,能解決重要問題。事實上,史料是積累起來的,尤其是基礎(chǔ)和核心史料,大部分都是已刊文獻。對已刊文獻不熟悉和掌握,而過分寄希望于未刊資料,很容易本末倒置,使研究陷入歧途。對此,似應(yīng)引起學(xué)人的足夠重視。
總之,“全面”“詳盡”占有資料,是相對而言的,每一代學(xué)人都曾面對過。關(guān)鍵是能否牢牢掌握基礎(chǔ)史料和核心史料,隨時把握專業(yè)領(lǐng)域內(nèi)史料發(fā)掘的基本動態(tài),并對新披露出的材料作出及時的判斷,不斷豐富自己對“有效”史料的占有。這才是應(yīng)對大數(shù)據(jù)時代史料“膨脹”的制勝之道。

馬忠文主編《近代史所藏李景銘檔案》
二、史料需要感悟
大數(shù)據(jù)時代數(shù)據(jù)無處不在,數(shù)據(jù)觀念深入人心,或有意,或無意,傳統(tǒng)史料都常常被以“數(shù)據(jù)”待之。這樣的轉(zhuǎn)變很微妙,甚至在一些人看來,史料和數(shù)據(jù)并無二致。其實不然。數(shù)據(jù)是科學(xué)概念,是指通過觀察、實驗或計算得出的結(jié)果,可以用來做新的研究、設(shè)計或決策。每一種數(shù)據(jù)都是確定的、唯一的、可直接采信的。史料則不同,從理論上說,每條史料作為文本,蘊含著特有的信息,都有其形成的語境和背景,史料需經(jīng)過考辨真?zhèn)魏?,方能取舍采信??梢?,史料不能完全等同于科學(xué)語境下只注重文本意義的數(shù)據(jù)。
前輩學(xué)者閱讀文獻,注重史料辨析,辨別真?zhèn)危词菍κ妨衔谋九c語境的綜合分析和考察,一定意義上說,史料學(xué)就是研究史料形成的歷史。史料的考辨是必不可少的環(huán)節(jié),直接與重建史實相關(guān),沒有史料固然不可能重建歷史,有了史料不甄別真?zhèn)危苯幽脕碛?,同樣無法構(gòu)建起令人信服的歷史。因此,在大數(shù)據(jù)時代,強調(diào)考訂,避免史料“數(shù)據(jù)式”的直接利用,意義不可小覷。人們不可能對每一件史料都去做細(xì)致的考察,但必須要樹立重視語境的意識和思維,并在研究實踐中貫徹始終,這一點并不為過。
現(xiàn)在保存下來的清代和民國政府檔案數(shù)量巨大,史料價值無需多言。特別是隨著數(shù)字掃描技術(shù)的普及,檔案數(shù)字化和網(wǎng)絡(luò)傳播技術(shù)的結(jié)合,出現(xiàn)了大批查閱方便的檔案數(shù)據(jù)庫。不過,當(dāng)我們打開頁面,看到各類原始官方文書時,切不可只當(dāng)其為文本或數(shù)據(jù),必須要考慮到這些檔案形成的過程和背景,才能更好地理解和使用它們。例如,清代外官和京官的奏折,都是經(jīng)過精心起草繕寫的,甚至上奏時間都可能是有計劃性的;清末一些地方督撫上折的同時,更是暗中聯(lián)絡(luò)言官,授意奏事,彼此呼應(yīng),制造聲勢。如此說來,僅僅看奏折內(nèi)容而不關(guān)注奏折背后的情形,恐怕很難了解歷史真相。研究晚清史,還需要熟知清代各類公文的流程和運轉(zhuǎn)機制。即以奏折而言,督撫和廷臣的奏疏,奉朱批后,由軍機處錄副,形成朱批奏折和錄副奏折兩個文書系統(tǒng),朱批返回到上奏者手中(以后再集中繳回),錄副則保存于軍機處。然而,也有不少原折被皇帝做了“留中”處理,這些被留中的原折并無批示,數(shù)日后發(fā)下“歸箍”,實際上摻入其他錄副奏折中被保存下來。這些沒有奉批的奏折,或被認(rèn)為是言官的“無稽之談”不值當(dāng)辦理,也有事關(guān)機密,皇帝甚至連軍機大臣也不希望他們知道,所以被“留中”(時人俗稱“淹了”)。今天查詢這些奏折,卻發(fā)現(xiàn)內(nèi)容多關(guān)朝局內(nèi)幕,難怪皇帝不愿讓他人知道。可見,不了解檔案形成的過程,就不能準(zhǔn)確地把握史料的真正價值。

王建朗、馬忠文主編《近代史研究所藏稿鈔本日記叢刊提要》
還有一類常見文獻——地方志,人們似乎也很少留意其形成過程。中國古代地方志是適應(yīng)大一統(tǒng)體制,借以反映地方歷史、風(fēng)俗、民情的文獻。一般說來,清代州縣地方志多聘請曾任職該州縣的長官主纂,再組織名流、士紳和長于文字的文人參與編纂而成。很多情況表明,州縣地方志的纂寫,大多受到地方世家大族勢力的制約,尤其是涉及地方宗族、家族傳記的內(nèi)容,褒揚隱諱,存在鮮明的傾向性。名門望族的孝行、烈女、貞婦明顯多于一般寒門小戶。了解這些情況,需結(jié)合其他文獻綜合考量,才能避免使用方志資料立論的片面性。
新聞報刊在晚清興起后,始終與中外關(guān)系、朝局變遷息息相關(guān),成為今天研究近代史的重要參考資料。特別是甲午戰(zhàn)爭后,近代報刊成為維新人士宣傳變法思想的陣地,報刊與政治的聯(lián)系愈加密切,庚子后革命黨人宣傳革命思想的報刊同樣風(fēng)靡一時??梢姡鷪罂陌l(fā)展與政治斗爭的興起始終伴隨,很難說報道內(nèi)容都是客觀真實的。在研究庚子后的晚清政局時,《申報》《大公報》中大量有關(guān)京城動態(tài)、派系斗爭報道和見聞,被研究者所引用,作為立論定性的依據(jù)。其實,太過依賴這類材料存在一定風(fēng)險。清末的報刊已經(jīng)介入政治斗爭中,地方督撫或拉攏、收買報刊,或自辦書報以為喉舌,媒介中的各類報道都有相對的傾向性,可否采信需要慎重對待。即如光緒三十三年(1907)丁未政潮期間《申報》對奕劻、岑春煊兩派斗法、慈禧太后態(tài)度變化等情形的報道,細(xì)節(jié)雖十分生動,卻未必可信,這些消息大多來源不明,系“無根之談”,多為京城官場中的傳言。所以,如果直接通過報刊數(shù)據(jù)庫檢索,拿來即用,不與其他日記、書信、電文等原始材料綜合考訂,得出的結(jié)論可能會遠(yuǎn)離真相。所以,使用材料必須要有探查其形成過程的意識。否則,史料很容易被消解成“數(shù)據(jù)”來簡單利用,歷史背后的復(fù)雜性很容易被遮掩或略去。
三、檢索不能取代史料研讀
傳統(tǒng)史學(xué)是通過對史料的搜集、考辨,再進入研究、撰寫階段。研究者通過對各類史料研讀,重建史實內(nèi)部的聯(lián)系,盡量恢復(fù)原始場景,尋求歷史內(nèi)在的因果關(guān)系,找出合乎情理的歷史邏輯,完成歷史過程的認(rèn)識??墒?,近些年數(shù)字技術(shù)的普及、史料的“膨脹”,以及檢索手段的迅捷,潛移默化地影響了史學(xué)研究的方式,“檢索史學(xué)”悄然出現(xiàn),用檢索材料來代替研讀史料的現(xiàn)象十分普遍,其實質(zhì)是淡化、省略史料考訂這個史學(xué)研究中最重要的環(huán)節(jié)。資料激增,確實給篩選、處理材料帶來了考驗,但大多數(shù)情況下研究者還是因為獲取資料便捷,便直接將研究的重心放在史料表層的處理上。不研讀史料,便不能進入歷史內(nèi)部,去獲得問題意識,進而展開研究;于是許多學(xué)者只好滿足于從大量平面化的資料中勾稽邏輯,將文章寫成邏輯嚴(yán)謹(jǐn)、文字流暢卻沒有歷史感的研究“論著”??梢哉f,這種新的八股模式是將史料“數(shù)據(jù)化”和簡單化的結(jié)果。
換個角度說,檢索本來也有難以克服的局限。檢索詞的選擇就不是簡單的事情。舉例來說,自從出現(xiàn)全文報刊數(shù)據(jù)庫后,通過檢索,利用近代報紙研究近代史變得十分普遍。像《申報》《大公報》《東方雜志》這樣的名報刊,引用率陡增,全文檢索大大開拓了研究者的視野,霎時間為研究者提供了靠人工翻閱無法獲取的新鮮史料,在建立近代史上各事件、人物的廣泛關(guān)聯(lián)性方面開辟了新天地,由此受益者多矣。然而,這種靠檢索建立歷史關(guān)聯(lián)的方法,效率似乎很高,局限性也是明顯的。畢竟,這種通過關(guān)鍵詞檢索建立起來的聯(lián)系,是外在的,與歷史本來的內(nèi)部聯(lián)系通常很難完全吻合。

徐雁平、馬忠文主編《晚清珍稀稿本日記》
以人物檢索為例,用什么樣的名字,才能搜索到豐富而完整的人物資料?這里不是簡單的科技文獻檢索,而是史料搜集,需要了解時人稱呼他人的各種習(xí)俗,對此今人未必都能盡知。按照清人習(xí)慣,直呼其名是大為失禮的,一般稱字號或官位尊稱,還有其他不同說法。舉例來說,如果查閱袁世凱的材料,只輸入“袁世凱”三個字是遠(yuǎn)遠(yuǎn)不夠的,這三個字通常只能查出《申報》中附載的《邸抄》《京報》中上諭或奏折,都是官方文獻;有關(guān)袁世凱的大量的信息,都是以其他代稱或敬稱反映出來的。袁氏曾官道員,駐朝鮮的通商委員,時人稱他為“袁道”“袁觀察”“袁委員”,升任直隸按察使后就有了“臬司”的官稱;袁氏字慰亭,也做慰廷,做山東巡撫、直隸總督時又被成為“袁慰帥”“慰帥”,丁未政潮后官外務(wù)部尚書時又稱“袁尚書”,更不用說“項城”“袁宮?!薄氨境酰ㄈ龂鴷r袁紹的字)”之類的代稱,這些都是查閱袁世凱資料時要考慮輸入的詞語。即便如此,可能還是有遺漏??梢姡罁?jù)全文數(shù)據(jù)庫檢索材料也不是做萬能的。我們在體驗到數(shù)據(jù)庫帶來的便利時,也應(yīng)考慮到再嚴(yán)密的檢索,也有掛一漏萬的時候。
大數(shù)據(jù)時代的各種資源共享與開放性,為學(xué)術(shù)研究帶來前所未有的有利條件,這是必須要肯定的,尤其是在校勘、輯佚、版本異同比較等文獻學(xué)領(lǐng)域功效尤為突出。但是,具體到史學(xué)研究,大數(shù)據(jù)只是在傳統(tǒng)意義的史料搜集上實現(xiàn)了歷史性的跨越,對研究本身的助力需要審慎評判。史料不是冰冷的數(shù)據(jù),史料是鮮活的,有溫度的,將史料“數(shù)據(jù)化”,忽略其語境和背景,實際已危害到史學(xué)作為學(xué)科存在的邊界。研讀史料和技術(shù)領(lǐng)域的數(shù)據(jù)利用畢竟是兩回事。史學(xué)研究還是要遵循從歷史內(nèi)部找到切入點,發(fā)掘內(nèi)在的歷史邏輯,而不是從資料外部尋求關(guān)聯(lián),以代替內(nèi)在的因果關(guān)系。在這個意義上,臺灣地區(qū)學(xué)者黃一農(nóng)教授多年前提出的“e考據(jù)”理論是對數(shù)字技術(shù)和史學(xué)結(jié)合的精準(zhǔn)概括,即運用最新技術(shù)條件,充實傳統(tǒng)史學(xué)以考據(jù)為基礎(chǔ)的研究方法,這種模式中,史料(數(shù)據(jù))檢索是作為一種補充手段而存在的,并非研究本身。
(本文首發(fā)于《近代史資料》總151號,澎湃新聞經(jīng)中國社科院近代史研究所《近代史資料》編輯部和作者授權(quán)轉(zhuǎn)載)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




