[祝平次]數位工具與文史研究

JANUARY 26, 2018

數位工具與文史研究

祝平次(國立清華大學中文系副教授)

元史專家蕭啟慶先生在1990年代曾是我在美國念書時的短暫室友,所以當我在2002年9月轉到清華大學中文系工作後沒多久,就去歷史所拜訪他。我還記得,當去他研究室時,他指著桌上的電腦,帶著童真的興奮說:「平次,如果我們那個時代有這個東西,我就會做通史研究,而不用侷限在元史了。」他所說的這個東西,就是電腦正在連線著的《四庫全書》全文檢索。蕭先生的話,指映出,數位工具與人文學研究的關聯:不一樣的工具可以完成不一樣的研究。就他所說的具體個案來講,則是研究範圍的廣窄,而這種擴展的可能性則在於全文檢索可以節省下大量蒐尋資料的時間。而2002年,也是台灣啟動國家型數位典藏計畫的一年。

從2002年到現在,數位典藏計畫在10年之後結束,科技部轉而籌設「數位人文」跨領域學門,然而在前後5年的時間裏,數位人文籌備學門又被終止,而接著教育部在今年(2018)啟動為期4年的數位人文創新課程的中綱計畫。撇開政府政策的更迭不定不論,數位人文在這15年的期間在全球化的時代裏的確變得越來越醒目,各個國家投入大量資源在數位典藏上,也開始設置大型的數位人文計畫申請案,而數位人文做為一種學術訓練也引起不少的爭議。但在這樣的浪潮之下,台灣的人文學界並沒有受到特別的影響。如果考慮蕭啟慶先生對於《四庫全書》全文檢索的童真地興奮,與15年後台灣數位人文在人文學界受到重視的情況來講,可以說數位人文的發展並沒有離開全文檢索的地步多遠。然而,其間卻有不少的單位以及個別學者投入不少的精力與時間,貢獻於這個「領域」的發展,可惜這些貢獻並沒有造成有明顯影響力的累積。而台灣的數位人文之於台灣的人文學界,目前可以說是一種可有可無的存在。

對於這樣一個還沒有打濕台灣人文學界腳背的學術浪潮,我們應該抱持怎樣的態度加以看待?到底數位人文研究使用的工具是什麼樣的工具?這些工具真得會使人文學科類同於自然科學與社會科學,而使得人文學迷失自我、誤入歧途,還是人文學原本就是人文科學,應該加強知識具體穩固的基礎,以利與其它知識領域進行整合與溝通?到底一個人文學者、一個人文學術機構應該對數位人文抱持什麼樣的態度?或者,換個方式說,今天的人文學應該跟十五年前、二十五年前、一百年前、兩百年前有什麼不一樣?或者,以追根究底的方式來說,到底人文學是什麼?在今天的任務或使命又是什麼?而這些問題,和數位人文又有什麼關係?

望文生義的「數位人文學」

就字面來看,數位人文學到底是什麼?我認為可以從三個方面來加以定義,而在之前科技部的申請計畫裏,也都可以看到這三方面的內容。

第一,從人文學的研究對象來講,這三十幾年人類生活已經進入繁密、快速的數位資訊交換時代,在這種情況下,有如科技史是以科技的歷史為研究對象一樣,數位人文學就是以人類數位生活為研究對象的人文學科。舉凡從社群網站、電腦遊戲、數位藝術、數位載具、居家照顧的數位系統、虛擬實境、人工智能等等所引起的人類生活的變化,都可以是研究的焦點。亦即,數位人文學只是人文學中一個領域的畫分,類同於研究「數位」的人文學,一分面標誌著時間的區段,如歷史學中的「中世紀」、「近世」等等;一分面標誌著空間內容的不同,如個人電腦、奈米等等,畢竟數位的時代也存在著娃娃機大為流行的事實。

第二,如果把「數位」當成一個形容詞,則數位人文學其實就是人文學,但標誌出人文學不同的時代進程,亦即人文學科現在進行的方式,舉凡我們的閱讀、書寫、研究的方式,乃至於思考,都離不開「數位」的媒介。現在全球不同地區依然在持續進行的數位典藏就是這種意涵的數位人文學的基底,而這樣的基底就像過去因著印刷術而大量產生的書籍、報刊一樣。如同印刷術的紙本媒介一樣,如何進行數位媒介的製造、登錄、校勘、修補等等,在西方的圖書館已經是存在一段時日的行業。西方學界已經進行三十年TEI(Text Encoding Initiative)的標記標準,就是一個最好的代表。而它在台灣的具體代表,就是法鼓文理學院聞名全球的CBETA電子佛典集成(http://www.cbeta.org/)。這裡面,數位媒介並不是單純地模擬、複製紙本媒介,而是有很多會更改閱讀習慣及便利性的設置,如交互參照的超連結與內建辭典。至於在數位媒介這個基底之上,人文學又應該怎麼再繼續進行或重新進行呢?陳淑君在〈初探人文學的數位研究工具類型與案例〉(https://drive.google.com/file/d/0B_maHvz_Lvw9NjNHcGNuZXZRV3c/view)的演講中,對於怎麼從研究的起點,到研究的發表,都已經有很好的整理,大家可以參考。而其中,數位工具的使用則是一大關鍵,也是數位人文學字面上的第三個意義,和本文的重點所在。但在進入這個重點之前,讓我們先想想去年和前年轟動一時的人機大戰事件。

在維基百科「艾倫.圖靈」(Alan Mathison Turing)條目中有下面這麼一段話:

「1952年,圖靈寫了一個西洋棋程序。可是,當時沒有一台計算機有足夠的運算能力去執行這個程序,他就模仿計算機,每走一步要用半小時。他與一位同事下了一盤,結果程序輸了。」(https://zh.wikipedia.org/wiki/艾伦·图灵)

到去年,世界聞名的AlphaGo Zero已從自我學習中,打敗中國最強的圍棋選手柯潔,而每一步的計算,不超過兩分鐘。更早一年,則有AlphaGo與李世乭的對戰。在對戰前,李世乭自認為人類的直覺要更優於電腦的計算。即使在研究過AlphaGo打敗歐洲冠軍職業兩段樊麾的對局之後,李世乭認為終局會是自己以5:0或4:1打敗AlphaGo。但結果是AlphaGo以4:1打敗李世乭。而一年後的AlphaGo Zero已是無人能敵,其中有部分的下法、布局概念,被認為和已故大家吳清源有相似之處。李世乭在五盤大戰的敗戰感言中,也曾說AlphaGo讓他認識到什麼是「圍棋」的創意,這也是李世乭本身一直在追求的下棋方式;也是AlphaGo DeepMind團隊帶領人Demis Hassabis在決定讓AlphaGo從圍棋界退休後,認為AlphaGo可以留下來給人類圍棋界的資產。

這個人機大戰的事例,可以讓我們從多方面來思考使用數位工具來進行人文學研究這一件事。例如:電腦能做什麼人不能做的事、人能做什麼電腦不能做的事、計算和直覺與創意的關係等等。但這些問題就留給大家繼續思考,回到本文的重點,就人機大戰史而言,可以看到電腦計算能力的大大提升所創造出來的可能性,以及另外一個台灣人文學科面臨更嚴重的問題:電腦的普及化所帶來的「知識」革命,可能使傳統的人文學科與普及化的知識生產模態形成落差,尤其在資料的蒐集、類聚與分析等方面。雖然這些看似只是比較機械性的工具,很容易令文史學者懷疑,如何能取代人類的分析;但想想AlphaGo的例子,也不妨把它當做一個新的機會,重新回答那個古老的人文學主題─到底人與機器有什麼不同;一個新的機會,再比較不抽象地來回答人文學知識的構成是怎麼一回事;一個新的機會,來檢視人文學科與自然學科的分界。即使就目前的狀況來講,電腦之所長和人腦之所長似乎很不一樣,但進行這些問題的思考,應有助於我們提前準備好未來的來臨。

祝平次(國立清華大學中文系副教授):數位工具與文史研究


圖1Python程式語言機器學習的套件中,可以看到分群和類聚兩大功能,也是人文學者研究時整理資料常常用到的兩種手段。(圖片來源:http://scikit-learn.org/stable/)

鐵錘與海綿

那到底有那些適合文史學科教學與研究的數位工具?

網路上分享的數位工具有很多,如果具體舉例來講,筆者從2014年3月到2016年6月進行了大約7個學期的科技部「數位人文推動計畫──數位人文研究人才培育計畫」,而這個計畫的重點之一,就是透過工作坊,讓參與的學員能個接觸、認識、 熟悉數位工具的操作與作用。在這些工作坊裏,我們介紹的工具類型有資料庫、地理資訊系統(GIS, Geographical Information System)、社會網絡分析(SNA, Social Network Analysis)、文本分析、文本標記。較為詳細的工作項目,請大家參考科技部《人文與社會科學簡訊》第19卷第一期的介紹〈搭起數位與人文的橋〉,下文只就這幾種類型,介紹它們的功能。

計畫工作坊利用《中國歷代人物傳記資料庫》(CBDB,China Biographical Database)來介紹關聯式資料庫(relational database)。關聯式資料庫是由許多不同的表格藉著相同的欄位連接起來,因此擁有強大的分析與綜合的功能。例如,在《中國歷代人物傳記資料庫》中,可以追踪呂祖謙家族從北宋到南宋遷移的軌迹;也可以很快比較宋代士人利用書信建立起來的社會網絡。

地理資訊系統可以將資料庫的地理資訊顯示在地圖上,透過地理資訊與資料庫其它資料的連結,則可以進行各式各樣的統計。例如,每次總統選舉時,不同候選人在各地區的得票率。大家常用的Google地圖的姊妹產品Google 地球就是一個地理資訊系統。在它們上面,可以規畫路徑、計算里程,乃至於連接到即時衛星就可以估計到達時間。而在文史學科的利用,則常常用來觀察地理分布,例如南宋初期和後期的進士分布是否有什麼變化,人口密度和進士多寡的比率是否相關。透過地理資訊系統的視覺化,有很多隱含在文史資料的空間問題,更容易被突顯出來。

社會網絡分析原是社會學的一個分支,研究的對象為社會行為者(人或社會機構)彼此之間的關係。這些複雜的關係可以經由電腦的運算,而以圖像的方式呈現出來。例如,南宋士人的社會網絡是以朱熹為中心,而南宋初期士人的政治網絡是以秦檜為中心。網絡關係圖中的節點與節點的關係,也可以擴大應用到其它的方面,例如事物的親和性關係。如果把出現在同一篇論文的關鍵詞定義為一種關係的話,就可以觀察到這些關鍵詞在某個時段所形成的網絡。藉由不同節點(人、機構、事物、概念)在網絡中所扮演的角色,就比?容易去解釋抽象的影響力和重要性等概念。也有學者曾經分析過目前學術科目的論文彼此引用的情形。在文學研究中,也可以被用來分析小說中的角色關係。

文本分析包括字詞頻統計分析、共現詞、前後綴詞、文本比對等等。藉由文本分析,可以很快地掌握文獻的大體概況,方便在宏觀與微觀的觀察之間移動。例如,將《宋史紀事本末》的人名進行分析統計,就可以看到這本史書所描繪的宋代歷史依照時序排列的事件中出現最頻繁的人名是那些。而整個過程,在備妥資料的情況下,大概20分鐘內就可以完成。我們也可以比較《論語》、《孟子》、《荀子》三個文本的用字情況有什麼大的不同。如果做共現詞的分析,還可以將得到的結果繪成網絡圖來加以觀察。政治大學中文系鄭文惠老師曾經利用《中國近現代思想及文學史專業數據庫(1830-1930)》進行過不少清末民初思想關鍵詞演變的研究,大家可以參考。

最後,文本標記(text tagging)通常會利用一種標記語言(markup language)來進行。例如,網頁的共同設定即是「超文本標記語言」(html, hypertext markup language)。網頁的原始文本其實有很多標記,但在網頁上卻不顯示出來。利用這樣的技術,可以保存原來的資料,又可以透過標記而有各種利用的方式。例如,儒家傳統的經典注疏至少有經注疏三個層次,加上標記,就可以很容易地研究注疏中引用其它文本的情形。就此而言,標記和傳統標點符號的作用類似。超文本標記語言由於主要是用於網頁,所以較為注重格式的顯示。而一般資料性的標記通常會是「可擴展標記語言」(XML, eXtensible Markup Language)的一種標準。前面說過的TEI就是一個例子。經過這樣標記的文本,就可以被當成是一個小型的資料庫,它雖然不像關聯性資料庫那麼結構化,但還是有資料串聯等等重要的資料庫功能。例如,如果把《宋史紀事本末》中的人名加以標記,就很容易透過資料連結,找出這些人名在《中國歷代人物傳記資料庫》的其它相關資料。人工標記文本非常地緩慢,若文本量太大,也容易發生錯誤。但標記文本猶如傳統的細讀,可以非常仔細地解析文本,所以如果研究對象的量並不大,還是一種值得學習的手段。而且在思索怎麼標記文本時,也常常會加深對文本各方面的理解。但若量太大,就不得不使用半自動的標記方式來進行,計畫工作坊介紹的由萊頓大學魏希德(Hilde De Wilde)和何浩洋一起發展的MARKUS(http://dh.chinese-empires.eu/markus/beta/)就是一種多功能的標記平台。

MARKUS除了是半自動標記的平台,也可以將已標記的資料連接到其它平台(網站),讓已標記的資料可以直接顯示在線上的地理資訊系統,也可以連結到漢典(http://www.zdic.net/),讓使用者把它當做一個幫助閱讀的平台。相對於個別的工具,這種研究平台將不同的工具匯聚一處,使用上更為便利。與漢學相關的研究平台,還有中國哲學書電子化計畫(http://ctext.org),它提供n-gram分析、文本異同比較等功能,並可直接繪成折線圖或網絡圖。在台灣,則有法鼓山文理學院的CBETA 數位研究平台(http://cbeta-rp.dila.edu.tw/),結合CBETA的佛學資料與不同的研究工具;台灣大學數位人文研究中心現在則正在發展能夠納入不同工具的DocuSky(http://docusky.digital.ntu.edu.tw/DocuSky/ds-01.home.html),另外中心的台灣歷史數位圖書館也有很多配合單一類文獻的研究平台。

有助於文史研究的數位工具多種多樣,大部分的功能都是用來整理、解析或視覺化資料。通常要完成一個計畫,會同時牽涉到數種工具。就像使用鐵錘不能完成使用海綿可以完成的作業一樣,怎麼樣從不同工具的組合來達到研究目的,在實做中去認識工具的優缺點、數位資料本身的限制等等,就有賴於研究經驗的累積。這也和傳統研究中的研究方法一樣。只是因為數位工具的特性比較突出,優缺點也會比較清楚。在一般工具之外,如果要讓電腦更深入地解析文本,就牽涉到語意的判斷,這就有賴於將語詞的定義、詞性的標記與句法的結構轉換成可資電腦判斷的資料。中央研究院中文詞知識庫小組就設置了一些語料庫與知識本體(ontology)可以做為這一方面發展的基礎,可惜似乎沒有和文史學者整合而有更具體的成果出現。(http://ckip.iis.sinica.edu.tw/CKIP/publication.htm#t3)

祝平次(國立清華大學中文系副教授):數位工具與文史研究

圖2史丹福大學開發的protégé與中研院漢籍電子文獻的比較
左圖是史丹福大學開發的protégé呈現知識本體的樣子,
而右圖是中研院漢籍電子文獻呈現《通典》結構的樣子。很容易見出兩者的相似性。

舊的不必去,新的必須來

數位人文的出現,有位歷史界的朋友,就問我:「是不是將來學歷史的,都要學會使用這些工具?」或換個方式問,數位人文是文史學界的典範轉移嗎?會全面性地或大規範地取代原來的研究範式嗎?我目前的答案是:舊的不必去,新的必須來。到底是什麼是新、什麼是舊,一樣是在人文學科的幽靈問題。但,我們可以來想想一些具體的事例。

考慮以前一些大部頭編纂的書籍,例如類書、地方志等等,它們的組織結構,和現在的資料庫結構,非常類似。也就是透過重新組織資料,以便更好地利用資料,來達成一些特定的目的。這大概也是有經驗的研究者,在研究途徑中都會發展出來的技巧。就此而言,很少促成數位工具後面的問題意識是新的,例如分群、類聚、比對、計量等等手段。但就工具的具體面來講,以前做這些工作,費時費力,容易產生錯誤;現在則容易將流程標準化,有錯誤較易發現,可以隨時更正,不斷累積成果,由學術群體協作共享。數位人文不必然是一種典範轉移,傳統的研究模式也有它累積的方式,也有很多很好的學術成果。但數位人文卻是人文學界思考怎麼向未來發展應該考慮的一個面向,因為他累積的速度與處理的範圍,都遠非傳統研究方式所可比擬。

如前文所說,數位人文學既是現今在量上值得考慮的一部分人類生活重要的內容;也是人文學本身各各部分的種種變化,對於這種變化的自覺與反省當然也很重要。而數位工具則會讓人文學的知識生產過程和其它知識領域產生重疊,既可增加人文學者對自己學科、對其它學科的理解;也有助於其它學科更好地理解人文學科。簡而言之,數位人文可以在知識的領域裏扮演橋樑的角色,而這種橋樑的角色有助於人文學者把自己的知識領域置於更大的知識範圍裏來思考,以及定位。

就筆者所接觸的台灣人文學科來講,大部分的情況是:人文學科既不受惠於現實生活,也不施惠於現實生活。這幾年不同的人文社會學門,例如巷仔口社會學、芭樂人類學、菜市場政治學、歷史學柑仔店,紛紛組織起來利用新的數位媒介推倒知識界線,可以認為就是對這種情形的反思。而這種反思之所以可能與必要,也與數位環境的變化有關,而這一變化也與人文學科未來的發展密切相關。但問題是,如果專家與大眾的知識界線越來越模糊時,文史學者又要怎麼來宣稱自己的專業?

在Aramis, or the Love of Technology一書中,Bruno Latour曾以書中主角的角色說:人人都有他自己的社會學。就像有次某醫療社會學家進行診治行為中醫病關係的社會學報告,聽完報告的醫生們大都覺得,這不用研究,我們也都知道啊。或像是筆者任教後,常聽到中文系同學所說的:老師,理工學院常常跟我們說,你們知道的我們都知道,我們知道的你們都不知道。或是一兩年前的線上爭議:有了維基百科,就不用教歷史了。簡而言之,人文學科做為一種學術科別的設置,有知識上的認同危機。這種認同危機,在歷史上表現為社會科學脫離於人文學。而不久之前,中正大學哲學系的系主任陳瑞麟也表示不反對將哲學系畫歸在理學院裏。面對這樣長久與當下的問題,亦即文史知識與其它知識的關係是什麼,人文學者已經準備好答案或回應了嗎?這些答案或回應的內容又會是什麼?還是傳統的標準答案:「兩種文化」,或「陽關道與獨木橋」嗎?

另外,就是知識範型的改變。現在做研究「離不開」全文檢索、資料庫的使用。花個幾分鐘想想這件事,就知道這件事事關重大。蕭啟慶先生的結論是研究領域可以擴大,也許等到將來,我們會說:研究的領域必須擴大。一個好的研究者當然會想窮盡所有的方法來加強它的研究。如同維基百科的存使我們必須面對上歷史課與讀維基效果異同的問題;當有好的研究工具存在或可能存在時,我們不也應該問一下這些工具向傳統的研究方式提出了什麼樣的比較的問題嗎?或就如李世㐓最後不得不認可,AlphaGo下圍期時的創意,為什麼人文學者不能想想數位工具的可能性,可以為人文學科帶來什麼樣創意?或就像AlphaGo也是人創造出來的,我們是不是也可以去創造一些目前還不存在的工具讓我們能更好地完成人文學者應該要完成的工作?

再考慮一下Google和微軟的情況,這兩大資訊界的龍頭用它們所提供的數位工具,界定了一個數位時代的人所必須具備的基本知識技能:編輯文件、使用試算表、利用投影片進行報告、設置網站(創設頁面、存取權管理)、整理照片、使用地圖(包括利用GPS記錄地點、繪製地圖)、與別人進行協作等等,若再加上蒐尋引擎的強大功能,可以說以前很多專家做的事,現在是坐在電腦前面做就可以完成。所以面對這些技能的普遍性,和它模糊化專家知識界線的事實,人文學者若不能對這些基本技能有一些掌握,很可能會形成一種奇特的知識(技能)落差,亦即我們可能很專業,但卻對這些普遍技能極其陌生。如果真有這樣的落差存在,那我們能不能更好地傳達我們的專業知識,可能也會變成一個問題。

而從積極面來講,前面所說的橋樑,不但可以是連結人文學科與其它知識領域的橋樑,也可以是人文學連結自身的過去與未來的橋樑。當然橋樑不只是橋樑,在面對橋樑可能通往的遠方而思索時,通常帶來的是,對於處在橋樑這端的自我的理解:到底人文學知識是什麼樣性質的知識?這樣的知識怎麼確立?這些是人文學者應該一直背負的知識問題,但在數位人文出現之後,原本應該是永遠被思索著的問題,卻變成攻擊數位人文的手段,而在國外引起一些爭議。

爭議、現況與未來

上文說了這麼多數位工具的好處,那為什麼發展數位人文會引發爭議?從學術史的角度來看,這些爭議與爭議時所使用的修辭自然也不新鮮,新的研究範型出現,如果會動搖到原來知識群體內部的權力結構,包括抽象的權威與具體的資源,就一定會引起爭議。

第一個爭議簡化來講就是數位人文學不是人文學。部分人文學者對於人文學者的意象似乎是個別學者的「好學深思,融會貫通」,認為一定要累積很久的閱讀、詮釋經驗才會有比較好的人文學知識的產出。建置資料庫、在地圖上標置出進士人口的分布狀況、畫出社會關係網絡圖、統計什麼文學作品在圖書館被什麼人借出幾次,這些技術性的操作似乎比較像是在市場賣菜,只要知道一斤多少錢就可以。這樣的批評有點像是認為知道在菜市場什麼菜的價錢多少就能賺錢一樣,把數位工具的使用從整個研究過程出來抽離出來加以批評。如上文所說,數位工具固然有時可以做為探測性的工具,用來偵測出值得注意的現象,但數位工具也可以是被問題意識所驅使,是用來滿足研究目的的手段。不管這兩種情形的那一種,其實和傳統研究的進行的形式並無不同,都只是研究過程的一個部分。即使就這個部分而言,要說它們是不是研究成果,或估量它們的學術貢獻,就像要評估以前的《十通》、類書、《宋元學案》等有沒人文學價值一樣。另外,就數位工具的使用能更好地彰顯出研究資料的完整性來講,雖然就區域部分限制了部分資料詮釋的可能性,所以似乎顯得較為直接淺薄;但使研究者的詮釋在資料的整全性上更加融貫,更有說服力。

爭議一的背後,還有一個亙古的擔憂:人被機器所取代。但與其抽象的擔憂,不如具體地列表,到底人有什麼不能被機器所取代的東西,而在發生機器取代之後,人能更專注發展的地方是什麼。另外,這也提供一個好機會讓我們去省察到底,整個研究的過程具體來講是怎麼進行的。例如去圖書館借書這件事,可能已經被下載PDF檔所取代;翻閱紙本資料,已經被全文檢索所取代。困難一點的,例如史料相對重要性,如依據文獻出現先後,給於不同的加權考量等,也是電腦很快就能學會的。機器目前還有很多不能做的事,人正好發揮所長。而機器能做的事就正好能幫助人做更多。所以有了維基百科,並不會取代歷史教學;但的確應該要影響到歷史教學將來發展的重點,另一方面當然也可想想怎麼讓維基在未來歷史學發展的過程扮演一定的角色。維基的修訂「歷史」記錄,本身就是一種非常有歷史意識的作法,雖然在資訊學科被稱為「版本控制」。人一部分能做的事情被機器所取代,其實是人的增能,而不是機器向人的奪權。至於人能不能善用這分增生出來的能力,那是另外一個問題,和人被不被機器取代沒有關係。

另外一個較大的爭議,則是數位人文的資源磁吸效應。數位人文計畫因為牽涉到很多技術性的建置,常常需要大量人力資源的投入,而大量的人力資源,也意味著大量的金錢和時間。在過去幾年各地政府與私人基金會投入在數位人文的資金,有的學者甚至以「學術帝國主義」來形容。到底多少的資源投入是合理的比例,這個問題牽涉範圍比較大,遠非從人文學界的立場就可以回答,畢竟人文學界自產的資源較少。所以對於這個爭議,本文比較想要從大的環境變化來講,而這個大的變化就是前文所講的媒體的轉換,亦即記錄過去的媒介不再是以紙本的方式來儲存,而是從紙本複製或直接製成的數位媒體。

數位媒體的產生相對來講其實簡化了對於古籍、古物大部分訊息的儲存,但利用度卻可以跨過時空,大大地提高。在空間上,也大大節省了儲藏的空間。在二十世紀的末期,各實體圖書館的善本書室紛紛面臨嚴重的管理經費問題,就是一個彰顯數位典藏長期而言比較便宜的最好例子。因此這一二十年來,數位典藏成了很多圖書館、博物館的選擇,也明顯地提昇了這些蘊藏公共知識機構的開放度。在這種情況之下,植基於資料的人文學研究自然也會有新的向度、新的使命:亦即讓這些數位典藏的可能性可以更充分地發揮出來。

就延續、擴展數位典藏的的利用度來講,數位人文研究可以說是順理成章、應有之義。就數位典藏的資料建置原有它自己的目的而言,數位人文的發展在這部分其實是省了資料建置的花費,如果不繼續發展數位人文,就原來就已建置的數位典藏材料來講,反而有點浪費。而且就歷史學或人類學來講,有些數位典藏的建置原本就是為了研究與展示,兩者都和數位人文有密切的關係。另外,數位人文的成果常常成為學界的共享資源,就此而言,吸收的資源和回饋的成果,以及成果的影響層面,應該要被同時考慮,而不應該只看到一邊的情況就加以批評。而且,如前文所說,數位工具常常是來自其它學科,例如資訊學界關於知識本體的建置,就對人文學界的研究很有幫助。在這種情況下,對於數位工具的使用不用花費建置的資源,卻可以擴展人文知識的範圍,也是人文學界應該好好思考的面向。一方面就抽象的知識概念和其它領域的知識概念可以有重合和交流,一方面也可以藉此來重新探查人文知識和其它知識領域的不同。

最後,台灣的人文學界習慣單打獨鬥,而不是進行群組協作,這樣的習慣和一個理想的數位人文計畫常常牽涉到不同專業的學者也很不一樣。具體來講,就是論文掛名的問題。雖然,台灣不斷出現自然科學學者掛名泛濫的問題,但掛名現象也沒有認真地被檢討;而人名學科則還是一如往常地單獨掛名。就傳統的研究方式來講,單獨掛名或至多雙掛,其實是合理的。但如果要進行數位人文研究,這樣的掛名方式卻會阻礙學者投入的意願。與此相關的,則是缺乏給數位人文學者的專任職位,這也非常不利數位人文的發展。而目前政府事事外包、民間資源很少投資學術發展等現象,也都不利於需要較多資源的數位人文長期的發展。

但目前國外的數位人文還是蓬勃地發展,顯示出人文學科和其它知識學門有比較密切的關聯。台灣的情形則固定每年12月初左右有一次數位典藏和數位人文學的國際會議,台灣數位人文學會也於2016年4月成立,目前也已設置學報。但由於數位人文學門的領域在籌備狀態下被科技部刪除,將來大勢會如何發展,很難預測。但與此同時,中央研究院的數位文化中心卻開始增聘博士後,展示對這個領域的企圖。就國外的情況而言,數位人文通常是人文學者在計畫中扮演主要角色,在台灣除了中央研究院和之前政治大學鄭文惠老師的團隊之外,卻都由非人文學者主導。這後面彰顯了學術分科結構與資源分配的差異。至於未來對台灣數位人文的發展為何,則尚待觀察。

台灣發展大型數位人文計畫的情況,除了屈指可數的幾個學術單位之外,可以說是不樂觀的。但如前文所言,網路上其實有不少開放使用的數位工具。在這樣的情況下,個別學者只要有興趣、有意願,還是可以透過自我學習參與數位人文的研究。在YouTube上也有很多的教學影片。像前文提到的推動計畫也錄製了四種關於使用中國歷代人物傳記資料庫、地理資訊系統與社會網絡分析的教學影片。就像其它開放課程一樣,藉由這些影片,來學會使用一些工具應該是沒有什麼問題。但如何在自己的研究實作中來加以應用,則會是更進一步的挑戰。

整體而言,就台灣人文學科目前資源的建置而言,並不利於數位人文的發展。但做為一種非常有潛力的研究方法,以及與國際學界進行交流的重要管道,筆者還是期待有個別的學者能夠投入,並慢慢累積以改變現況。若能進一步的與一些機構的數位檔案館結合,讓這些檔案、館藏能夠更顯示出數位化的優勢,也是一條可能的管道。其次,若能出現典範型的研究,也有助於轉變風氣。最後,教育部四年期的數位人文創新教學計畫在今年啟動,由於台灣數位人文學者的散佈並不普遍,成果目前無法預期。但前導的示範課程已經上線(https://www.dhci.digital.ntu.edu.tw/courses),就資源的分配與數位工具使用也都有一些教育與示範性的作用。雖然,這些相對少量資源的投入,很難一下子看出大的變化,但有累積就有作用。也希望台灣的人文學界,思考未來,對於數位人文的發展能夠有更積極的回應和作為。

本文採用創用CC 姓名標示-非商業使用-禁止改作 3.0 台灣版條款授權。

祝平次/數位工具與文史研究
(http://kam-a-tiam.typepad.com/blog/2018/01/數位工具與文史研究.html)

http://kam-a-tiam.typepad.com/blog/2018/01/%E6%95%B8%E4%BD%8D%E5%B7%A5%E5%85%B7%E8%88%87%E6%96%87%E5%8F%B2%E7%A0%94%E7%A9%B6.html

始发于微信公众号:台湾人文与学术

About the Author: DH