當前位置:首頁 >> 人文精神

文章

人文研究數字化:一場方興未艾的變革

發稿時間:2021-10-22 14:31:45   來源:《光明日報》  

        清華大學人文學院院長萬(wan) 俊人30多年前在北京大學讀書(shu) 時,曾問過北大曆史係教授田餘(yu) 慶一個(ge) 問題:“田先生,‘二十四史’您看了幾遍?”

“傻小子,沒有一個(ge) 史學家能夠讀完‘二十四史’的。”田餘(yu) 慶的回答,給萬(wan) 俊人留下了深刻印象。

如今,有了古籍數據庫,輸入關(guan) 鍵詞,瞬間,“二十四史”中的相關(guan) 內(nei) 容就湧現在眼前了,檢索和閱讀的便捷性有了極大提升。讀完“二十四史”雖然仍然需要下苦功夫,但利用“二十四史”已經越來越方便。

從(cong) 紙本閱讀到檢索係統,從(cong) 檢索係統到分析係統,人文學術的研究工具正在向“數字化”的方向轉變,和萬(wan) 俊人一樣,很多人文學者的研究中越來越離不開“數字”了。

“不數字無人文的時代”到來

在信息的汪洋裏,既要放寬眼界,又要盯準目標,不被淹沒,是學者們(men) 共同的需求和願望。

“現在我們(men) 處在海量的信息中,這信息量不是宏觀,而是巨觀的。”台灣大學資訊工程係教授、數位人文中心主任項潔如是說。

從(cong) 微觀到中觀,從(cong) 中觀到宏觀,再到巨觀,信息視域越來越廣闊無邊。人文學者如何駕馭浩如煙海的文獻材料?數字技術能幫他們(men) 做什麽(me) ?

“對於(yu) 人文學者來講,從(cong) 來不是看幾篇文章就可以開始寫(xie) 作,而是要看大量的文獻才敢下筆。”項潔分析道,“因為(wei) 作者檢索到的文獻是一個(ge) 係統,要找出這些文獻之間的脈絡關(guan) 係,是至關(guan) 重要的事情。”

“如果一位學者僅(jin) 僅(jin) 具備本學科的學術訓練,而不具備數字思維,欠缺運用數字技術進行研究的能力,即使他的學術功底再紮實,今後也寸步難行。”商務印書(shu) 館執行董事顧青說,“目前,我們(men) 利用數字技術進行人文學術研究的人群還不夠多。我堅信,在不遠的將來,我們(men) 不必再用‘數字人文’這樣的名號來宣示我們(men) 區別於(yu) 傳(chuan) 統研究的立場。因為(wei) ,‘不數字無人文的時代’已經到來,數字人文將深刻地改變學者,尤其是人文社科學者們(men) 的知識結構和研究路徑。”

事實上,在一些學者看來,人文與(yu) 數字,從(cong) 來就沒有分過家。

萬(wan) 俊人從(cong) 古埃及、古希臘的建築和哲學中,指出數字人文的神妙:“埃及金字塔,至今還是一個(ge) 謎。它之所以能夠曆經4700多年的風雨,不隻有古埃及人的信仰、圖騰和崇拜因素,還有數字的因素。在一片茫茫大漠的頂端,鑄造了繁多規整和雄偉(wei) 的建築,而且是用巨大的石頭壘起來,沒有精確的數字計算,是不能夠做到這一點的。”

萬(wan) 俊人認為(wei) ,人文學術的源頭就與(yu) 數字有關(guan) 。他說:“古希臘哲學家畢達哥拉斯,他的哲學源自數字。從(cong) 他開始,希臘哲學開始產(chan) 生了數學的傳(chuan) 統。中國古代哲學也是如此,例如《易經》。所以,人文和數字從(cong) 一開始就是孿生兄妹,隻不過在後來的歲月裏,兩(liang) 者走得比較遠了些,看似它們(men) 已經告別了,其實它們(men) 一直在同一條路上,與(yu) 人類文明和文化同行。”

用數字方法,解決(jue) 人文研究難題

數字人文的發展動力,在於(yu) 采用新的方法,解決(jue) 過去難以解決(jue) 的問題。

多年來,項潔研究團隊一直致力於(yu) 滿足人文學者對內(nei) 容數字化的需求,建立一個(ge) 屬於(yu) 他們(men) 自己的資料庫,來處理、標注和分析資料,使內(nei) 容和工具能夠互動起來。

顧青回憶起30多年前,他在北京大學讀書(shu) 的時候,上過一門“工具書(shu) 使用”的課程,講的都是怎麽(me) 使用紙質工具書(shu) 。今天,這門課程涉及的很多工具書(shu) 已經可以被數字化工具所取代,其中的一些工具書(shu) 已進入古籍收藏家的視野,實用價(jia) 值遠不如從(cong) 前。

清華大學人文學院副教授李飛躍和中國社會(hui) 科學院文學研究所助理研究員趙薇介紹,幾十年來中國人文學科的定量分析成果紛紛湧現,用數字手段檢驗和打破了一些人們(men) 習(xi) 焉不察的定見:

20世紀80年代,陳炳藻、李賢平、施健軍(jun) 和陳大康等海內(nei) 外中國學者分別采用文體(ti) 測量學的辦法,利用人工統計或計算機輔助手段,對《石頭記》前八十回、後四十回作者統一性問題作出判定;2005年,哈佛大學包弼德與(yu) 北京大學等合建“中國曆代人物傳(chuan) 記資料庫”(CBDB);2001年,複旦大學和哈佛大學共建“中國曆史地理信息係統”(CHGIS)等,這些人文學者是數字人文的先行者。

“長安城圖的精準化和數位化應用”,這是台灣中山大學中文係教授簡錦鬆利用數字化技術進行的一項研究。據他介紹,過去學界對唐代長安城的了解,都是從(cong) 留存下來的紙質圖上看到的。現在可以對原始的古圖做數字化處理,然後放進電子地圖裏,就能看到精準的長安古城麵貌了。

這項研究既有學術價(jia) 值,也很有趣。比如,有了這張數字化圖,就可以知道白居易的家住在哪裏,上朝要走多久;也可以知道韓愈從(cong) 家裏出來拜訪張繼,要經過什麽(me) 路徑;李商隱為(wei) 悼念亡妻寫(xie) 下了著名的《西亭》:“此夜西亭月正圓,疏簾相伴宿風煙。梧桐莫更翻清露,孤鶴從(cong) 來不得眠。”從(cong) 李商隱家到他妻子娘家的居所西亭,路程並不遙遠,隻有1.7公裏。

借助中南民族大學文學與(yu) 新聞傳(chuan) 播學院王兆鵬教授構建的“唐宋文學編年地圖平台”和“漢魏六朝文學編年地圖平台”數據庫,也可以了解唐宋時期和漢魏六朝時期作家的活動情況。

“數字人文,能夠在相當程度上幫助傳(chuan) 統的研究工作,讓學者們(men) 有更多時間去做計算機目前還不能做的研究。”清華大學人文學院教授、《數字人文》期刊主編劉石說。比如,古籍標點、字句校勘、索引編纂、資料匯編,過去的學者在這些方麵花費了大量心血,如今都可以借助計算機去完成。

建立起知識的關(guan) 聯,是數字人文的本事

數字人文興(xing) 起的前提,是人文資料和文獻檔案的電子化與(yu) 數據化。

劉石認為(wei) ,當今社會(hui) ,數字化的浪潮無所不在,也深刻地影響著包括人文和社會(hui) 科學在內(nei) 的一切領域。數字人文,推動了當代文獻學的發展,使之形成數據驅動、實證為(wei) 先的新特征。“前幾年,人文學界有一種輕文獻考辨、重義(yi) 理闡發的現象,導致學風空疏的傾(qing) 向。現在有了數字人文,你想空疏都空疏不了。因為(wei) ,數字人文中的大數據,不就是拿數據說話的實證研究嗎?所以,從(cong) 這個(ge) 角度講,文獻學、古籍整理,或者考據學,今後不見得會(hui) 消亡,反而會(hui) 隨著數字人文的發展獲得新的活力。”

眾(zhong) 所周知,錢鍾書(shu) 先生博聞強記,而他的記憶力與(yu) 他的學術成就息息相關(guan) 。有人提出疑問:進入數字人文時代,學者的記憶能力還重要嗎?清華大學計算機科學與(yu) 技術係主任、《數字人文》期刊主編孫茂鬆教授認為(wei) :“實際上,電腦時代並不意味著什麽(me) 都能搜索到。數字人文要做的,不是把死的知識存在那裏,而是要建立起不同知識間的關(guan) 聯,有豐(feng) 富的知識聯想,讓知識活起來,進行深入的學術融合。”

“我們(men) 現在遇到的一個(ge) 最大的問題,就是有了大量的電子文本之後,怎樣利用這些數據庫進行研究?”美國巴克內(nei) 爾大學東(dong) 亞(ya) 研究係教授陳鬆說。

因為(wei) ,人工智能必須由人去做,才會(hui) 智能,才有可能做出有價(jia) 值的研究。

李飛躍從(cong) 教學角度來分析數字人文:“過去我們(men) 說,知識就是力量。工業(ye) 化時代標準化的教育,更重視知識技能的傳(chuan) 授教育。如今,信息時代的教育有一個(ge) 非常重要的特點,就是更重視建立知識之間的關(guan) 聯,這才是力量。”

正如項潔所說的那樣,這些細微而生動的數字化,“從(cong) 巨觀上,穿越了不同知識和學科之間的隔斷,才能從(cong) 微觀上直達知識的細節”。

“從(cong) 科學革命開始,學界有一個(ge) 很大的分流,就是理工以發現為(wei) 主,人文則以解釋為(wei) 主。如今,有了數字人文這座新的橋梁,把以發現為(wei) 主的理工學術帶到人文學界,人文學術將會(hui) 有新的發展。”香港科技大學人文與(yu) 社會(hui) 科學學院教授李中清說。

“數字人文是人文社科學術研究的未來,希望在信息科技領域中,有最懂傳(chuan) 統文化的人;在人文學術界中,有最懂數字技術的人。”這是顧青的期待,也是學者們(men) 共同的期盼。(記者 計亞(ya) 男 杜羽)


 


友情鏈接: