数字人文的方法理解及其反思

转载请注明“刊载于《数字人文研究》2021年第4期”;参考文献格式:杨庆峰. 数字人文的方法理解及其反思[J].数字人文研究,2021(4):3-10.全文PDF已在编辑部网站http://dhr.ruc.edu.cn上发表,此处注释及参考文献从略。

摘   要

数字人文领域出现的“实践先于理论”的态势使得“作为技术方法的数字人文”观点被广为接受,其本质是一种技术工具论的理解。尽管文学界提出“作为研究范式的数字人文”这一具有自我反思意识的观点,但尚显微弱,并且依然受技术工具论的束缚。因此,要将这种微弱的自我反思意识给予强化,从根本上还是要深入反思技术工具论的观念,指出被其遮蔽的诸多维度。数字人文的真正意义在于不仅使得人文研究的非文本的领域得以重新展现,并且有着将非人经验、数字对象等领域展开的可能性。

关键词

数字人文;人的本质;非人经验

作者简介

杨庆峰,复旦大学生命医学伦理研究中心教授,复旦发展研究院研究员。Email:y_qf@fudan.edu.cn。


0

引   言

如今,数字人文研究已成显学,并且表现出明显的“实践先于理论”的态势。所谓实践先于理论,是指虚拟现实技术、数字技术等已经在实践领域运用并且取得了显著成效,而对数字技术应用的可能性后果的分析、数字人文的理论反思却显得滞后。从人文研究领域看,传统的反思方法已经陷入停滞,亟需新的方法解决所谓技术时代、智能时代或者计算时代人文研究面临的窘境。相比各类自然科学研究、社会科学研究的成果迭出,人文研究盛况不再,随着一些大师的离去,更加青黄不接。因此,当虚拟技术、人工智能、数字技术等新的研究工具出现,人们看到了改善这种状况的可能性。上述技术在自然科学发展、知识创造上表现出了强大的效能,如AI可以发现人类不能发现的癌症基因、DeepMind的算法Alphafold2预测了蛋白质的3D结构——这无疑也刺激着人文学者的敏感神经,如何利用如AI、数字技术等新工具并发现新的对象及问题就成了令人着迷的问题。如今,成效大显,如极度快速的搜索引擎等技术可以让阅读文献变得快速;使用如X-ray micro tomography(XMT)等各类扫描技术阅读古代的破损信件以及无损坏地阅读加密文献完全成为可能。于是这种态势下形成了一个被普遍接受的观念:数字人文作为一种技术方法。这种观念存在着明显的问题,会制约数字人文研究的发展,所以需要进行更深一步的反思。


1

作为技术方法的数字人文

“数字人文研究”则更多是一种研究实践的代称,即将传统的人文研究的对象形式加以数字化并利用数字技术处理数字资源的过程。这导致更加强调关注新技术带来的冲击和影响。20世纪60年代以来的信息论、系统论和控制论给予人文学者的影响很深。以控制论为例,这种科学方法与思想对哲学家的影响很是明显。海德格尔在其对现代技术的反思中充分表现了出来,“海德格尔的一个著名论断认为,控制论标志着形而上学的终结——或者我们可以称这一事件为伟大的完结……海德格尔不仅看到控制论的主要特征是把每个过程都转化为可计算的、可驾驭的过程,他也把控制论理解为一种新方法对于科学的胜利。这种方法是反馈的概念化。”2010年以来,随着大数据、人工智能等技术的成熟,这种冲击和影响更深,不仅是方法层面的,还有多种主体形式的,比如创造主体,算法可以创造艺术作品,并且拍卖成功;AI可以写诗歌,让人赞叹。这些已然在现实生活领域中发生的事情对于“研究主体”概念无疑是一个严重的冲击。是否会有非人的研究主体出现也成为不得不严肃思考的问题了。无论人文学者接受或是不接受,怀疑或是赞叹,事实总是发生了。还有经验问题,人类通过学习可以获得经验,形成记忆,而这构成了自我认同与个体身份构建的前提条件。今天,机器学习与深度学习算法也在大量地吃进数据,形成了独特的“数据-经验”,这种“数据-经验”与人类经验的关系也得到了一定的探讨。

数字技术的强大效能的确带来了人文研究的明显改进,比如文本的数字化、数字文本的可视化、数据检索和模式化。其中,文本的数字化除了我们通常理解的把典籍数字化之外,还有对破损之物的数字化。“破损”主要是指材料由于年代久远而自然损坏,比如纸张破损、文字变得模糊。对于历史等学科的研究来说,破损之物的价值可能会超过现有的完整之物。新的成像技术可以做到在不损坏原物的情况下虚拟显示原物的内容,甚至可以做到数字修复。这样的强大功能使得数字技术成为一种称手的工具。比如要保存容易损毁的纸质古籍,可将其扫描转成数字文档;还可以让文物变“活”,将其虚拟化之后制成符合时代特征的形式。

与这种实践效能形成鲜明的比对的是,关于数字人文的理论反思却异常滞后。很显然,宏观性的批判理论,如海德格尔、艾吕尔式的批判并不能直接抓住到底何种东西扰动了人文研究者的敏感神经,反而让宏大的批判理论持有者无法理解的是,为什么部分人文主义者着迷于这种技术手段?当前的情况是,缺乏足够有力的范畴来理解当前盛行的数字人文实践。也许数字人文学者正处于一个中间地带。在技术专家看来,这一领域无疑是一个新的技术应用的场所,他们也渴望进入其中。事实上这已经发生了,国内外很多数字人文研讨会都有技术专家的介入,尽管是初次碰撞,但是难掩各自的喜悦和收获。而在传统人文学者眼中,这种尝试对于现有的人文研究方法产生了极大的冲击。他们的矛盾心态——徘徊游疑,产生出一种抵抗力。当然这种抵抗是指向技术对于人文的“入侵”。

这种态势最终导致了一个矛盾的盛行,即围绕数字人文的方法特性,在保守的人文研究者与数字人文研究者之间形成了对立。对于前者而言,数字技术只能表现为技术方法,而不能变成其他。这种态度中隐含着一种对技术危机的担忧与对人类自由的捍卫。这倒也符合现象学家胡塞尔的观念,欧洲科学的危机恰恰是作为方法的科学成为事实本身。只是相比之下,保守的人文研究者并没有自觉地意识到发生了什么。而在数字人文研究者看来,这种观念显然是有问题的。因为数字技术已经显现出超越技术方法的内涵,具有了“新工具”的特性。从技术哲学的角度看,“数字人文只能表现为技术方法”,可以称作是数字人文领域中的技术工具论观念。数字人文是数字技术、增强现实等技术与传统人文学科产生碰撞的结果,然而在后来的研究中出现了一种错误的理解。对这种理解不加反思地接受使得数字人文自身的整体意蕴被遮蔽,所以需要进一步地加以考察。


2

数字技术的新工具特征

数字技术对于人文研究而言是一种什么意义上的新工具?这是我们接下来要分析的问题。“新工具”并非是一个拍脑袋的概念,而是有着思想史背景的。英国哲学家弗兰西斯·培根(1561—1626)撰写了一部著作,内容是关于研究自然的指导原则,后来以《新工具》为名出版,在导言末尾培根提出了“解释自然”的两种道路。“钻研和发现真理,有亦只有两条道路。一条道路是从感官和特殊的东西飞跃到最普遍的原理,其真理性即被视为已定而不可动摇,而由这些原理进而去判断,进而去发现一些中级的公理。这是现在流行的方法。另一条是从感官和特殊的东西引出一些原理,经由逐步而无间断的上升,直至最后才达到最普通的原理。这是正确的方法。但迄今还未试行过。”这一说法有三重意思需要我们注意到:(1)解释自然是科学最高的理论任务;(2)感官与感官认识是新工具的开端;(3)科学成就即经过上升最后抵达概念和原理。在培根所在的那个时期,解释自然并非从感官认识开始,而是从宗教神学的文本入手,要抵达的真理之地是上帝。所以对于培根来说,“新”的意义是从文本理性到感官认识的转变。而“感官认识”在整个中世纪哲学中是被看作被抛弃的功能,无益于真理的获得。

数字技术的工具性作用已经确定无疑了,但它在什么意义上是“新”的呢?对比来看,它的“新”已经不再是培根意义上的“新”了,具体表现为四个方面。

首先为技术本质之新。数字技术在人类技术史上是一种完全新的形式,它基于计算机技术而成,在模拟本质上展现出强大的力量。所以它不仅是技术自身的新,在技术之本质上也是全新的。

其次在于构建对象的方式之新。在满足人类之需求上,数字技术的效能并不是那么明显,也不直接提升行为的效能。挖掘机、盾构这样的大型机器装置可以让生产效率大大提高,然而0、1所构成的数字对象、数字体验却无从产生直接的效率。最初呈现在电脑屏幕上的符号、图像显得是那么孤立存在。但正如海德格尔指出的那样,从来没有一个技术物品会单独存在。“严格地说,从没有一件用具这样的东西‘存在’。属于用具的存在的一向总是一个用具整体。只有在这个用具整体中那件用具才能够是它所是的东西。”数字对象的种类遵循着模拟现实的路径在不停地增强、变多——元宇宙的生成最终是这样一个结果,组合成一个充满关联的技术系统,这样的一个系统开始生成新的虚拟对象。

第三,作为研究方法呈现出了文本的新的关联形式。数据挖掘、深度学习等技术方法能够揭示出文本非直观形式的对象关联,让研究者可以得出新的结论。以斯蒂格勒的《技术与时间》为例,面对“这本书的主题是什么?”这样一个问题,感性直觉告诉我们,这本书似乎是从时间性角度阐述技术,技术是理所当然的主题,这一结论同时也可以得到理性上的验证。熟悉斯蒂格勒的学者都知道,他的哲学创作的源头文本就是海德格尔的《存在与时间》。而对于斯蒂格勒来说,他对技术感兴趣,借助海德格尔的时间性概念来认识技术显得非常合理。然而,如果对这个文本进行词频统计,“记忆”出现的频率竟然超过了“技术”。新的结论是,主题变成了“记忆”——斯蒂格勒的思想之中隐藏着一条“记忆之绳”。而且,第三记忆不仅是一根体现在不同阶段文本的线索,更是一条隐隐变得明显的大绳,并且这个主题的意义还在于能够让我们找到对抗这个时代的武器。这个结论甚至可以从斯蒂格勒的另一思想源头那里得到解释验证。当我们触及其写作的拐杖——安德烈.勒瓦鲁-古汉(Andre Leroi-Gourhan),一切都变得容易理解了。正如许煜指出的,古汉的技术思想主要是强调记忆的外化(exteriorization)和器官的解放。接受古汉的分析的结果之一,是“记忆”成了《技术与时间》整部著作的隐性主题。当然这只是一个小的例证。可以想见,如使用更强大的搜索对比工具对文本进行分析、重构,那么颠覆传统的一些观点并不是不可能。当然,还需要能够找到理性的确证,否则由数字技术呈现的对象关联形式以及新的观点难以立足。

第四,数字技术可能构筑出一个新的本体类型。第三点提及的技术应用只是揭示了现成文本中的概念、语词之间的关联及其模式特征,数字技术构建而出的数字世界却会成为新的对象类型。它并非自然对象,虚拟的数字苹果似乎将原本统一的自然对象的属性加以分离。未来的虚拟现实技术可以让这个苹果变得有香味、可触摸、可见,但是却不能吃,无法从其获得自然物给予人类有机体的营养成分。这些属性的获得并非是同时性的,也是经过时间叠加的结果,毕竟技术发展并不是一蹴而就的,这就使得虚拟对象也具有了自然对象的时间性特征。只是在更远的未来,这种时间性也变得不再必要,而这对于自然对象来说却是根本之物。此外,它与自然对象之间的模拟关系也只是低级形式的表现。在高级形式之中,数字对象超越了经验限制,显示出想象的所指。全新的数字对象被构建出来。对自然的虚拟模拟抵达了其界限,我们将进入一个非自然的对象建构之中。

以上的分析简要说明了数字技术作为一种新工具存在的可能性。它并非培根意义上的新,也并非获得概念和命题意义上的新,而是技术本质意义上的新,能够揭示出文本对象新的内在关联,更为重要的是给予本体类型的新。在知识领域中,行为赋对象,而对数字对象而言,数字赋能对象。在这个过程中,并不是意义的获得,而是能动性的获得。


3

作为方法论新范式的数字人文

在上面的分析中我们已经指出,数字技术表现为效率强大的工具,而且具有“新工具”之关键所在。这一观点以否定的方式指出“数字人文并不仅仅是技术”,在这一观点之下,数字人文的“技术本质理解之新”“构建对象方式之新”“文本关联形式之新”以及“本体类型构筑之新”等四个新工具特性已经逐步明显起来。通过运用数字化工具,实现了搜索效率提高、数据可视化,更为重要的是,“让事物活起来”的可能性也显现出来。同时,该观点以肯定的方式指出“数字人文是方法论意义上的新研究范式”,这应该是有所突破的——它在极力挣脱技术工具论的强大束缚。然而,这种声音又是“微弱的反思”。之所以说微弱,不仅仅指其并没有引发足够注意,还在于其并没有揭示出“数字人文是方法论意义上的范式”观念背后的理论预设。

首先是对“范式”(Paradigm)的概念把握存在不准确的情况。“范式”概念来自美国科学哲学家库恩,他主要从科学史的角度说明不同时期的科学共同体研究遵循的某些普遍概念、原则和方法,不同范式之间具有很重要的不可通约的特征。而在“数字人文”这个表达中,我们只是看到技术这一面,而其所遵循的概念、原则并没有得到足够的分析。如果没有成熟的理念、原则,那么只能说在指向上具有一种范式变革的可能性。再看目前数字人文各个领域,充满了多种探索和争鸣,但除了在技术应用上取得了比较一致的认可外,并没有相应的原则、概念被确立起来。

其次,“作为方法论的研究范式”这样的判定,有可能强化了技术工具论的观念。数字技术在这种趋势中愈加被作为一个系统化的研究工具来看待。这样做的结果如何呢?把目光转回到20世纪初,胡塞尔指出当时的科学危机表现为“科学丧失其对生活的意义”,而这也是实证主义科学的缺陷所在,这种将科学理念还原为纯粹事实的科学,最终导致了人及其生活意义的丧失。“单纯注重事实的科学,造就单纯注重事实的人”,这种危机本身是实证主义精神的发展所致。今天面对数字人文,我们依然会看到一种类似的过程:本来是方法的东西正在被当作事实本身。所以,学者表现出的热情拥抱却让人不由地担心,这很容易让人想起伽达默尔。根据伽达默尔,方法论的狂热崇拜者是未经充分反思的人。对数字方法以及方法论过于关注的人至少会丧失数字对象、数字经验以及数字主体这样的视点。

此外,我们还需要对比分析一下上述两个观点之间的关联。“作为技术方法的数字人文”这一观念强调的是人文研究方法使用了数字技术等新的工具,在这一观念中,研究方法成为被阐发的问题,并且技术工具论成为一个明确的根据。“作为方法论范式的数字人文”观念中,数字技术具有一种超越单一方法的因素,然而,即便是多种方法的综合使用,也依然是一种方法意义上的讨论,难以摆脱技术工具论的束缚。与此同时,这一观念还微弱地指向了一个正在发生的事实:数据正在成为驱动人文研究范式变革的动力。这隐约地显示了人文研究对象正在发生的变化。不过这一点尚不明了,还需要更多的揭示。技术哲学正在揭示出的维贝克式的“技术调节行为”理念恰恰表明了这样一个迹象。只是维贝克的视角更倾向于道德行为如何为技术塑造,还有其他的非道德行为如何由技术塑造需要揭示。也许对于人文研究来说,还需要面对两类新的人类形象所带来的问题,一类是想象意向中诸如“后人类”“超人类”等,另一类则是现实意向中的人—机融合。


4

作为非人经验与数字对象的呈现

如果从微弱反思观点中的否定性与肯定性因素来看,很容易想到接下来的超越可能是按照黑格尔式的辩证逻辑展开,即寻求一种更高的整体性的东西,也就是说在否定性表达与肯定性表达中找到一个整体,作为整体性的存在往往是一个矛盾对立的运动终点。但是本文并不是要抵达一个终点,而是要从一个现象学式的问题开始:这一观念会不会重新导致将本是方法的东西当作事实本身?在胡塞尔看来,实证科学最大的危机就在于造成了只见事实的人。而今天数字化技术正在使用强大力量将一切对象数字化。但“数字化”这个概念隐藏着的三个维度需要被关注到。

第一,数字化意味着计算化。从某个意义上理解,数字人文的内核是计算化。“数字人文的内核是计算性的”,算法成为一个很重要的方法影响了人文学科的研究。在这个过程中,人文研究的对象就变得可被数字化,从而可被计算化。这一点往往会从人的生存状态上表现出来。在人与世界打交道的过程中,算法已经成为一个决定性的影响因素存在了,我们的生活、消费、生产等活动都受到算法的影响,或者说是算法的规训。

第二,数字化意味着虚拟化。数字化的虚拟化意味着与物理材料的存在相区别的状态。如果把文本、物、活动等当成是现实的对象,那么对其进行数字化转化之后的存在者就成为虚拟存在了,不具备显然的现实性了。

第三,数字化意味着图像可视化。数字化的可视化意味着可以以图示的方式揭示文本内在的联系。

再回到当前的数字人文实践活动本身,有一点就变得明显了:数字技术数字人文的研究如果只是指向文本,那么则过于狭隘化了这一技术领域所具有的变革意义,其并非仅仅是用于分析文本的工具,而是有着更多需要被揭示的内容。

首先,数字人文揭示出一个人文研究轻视的非文本领域。法国哲学家保罗·利科揭示了非文本的历史活动形式。他首先将历史活动划分为“档案、理解/解释和历史表象”三个环节,又将历史知识的三个基座揭示了出来:“因此,痕迹、文献和问题就构成了历史知识的三座基座”。在面对历史观察对象的时候,他将历史对象区分为文字的和非文字的表达,“不过还是有一些不是‘文字见证’但同样属于历史观察的痕迹,即考古学最钟爱的‘过去的遗迹’:陶翁、工具、硬币、画像或篆刻出来的图像、丧葬物品、残存的住宅等。我们可以在广义上称之为‘非文字的见证’,尽管这可能会和口述见证发生混淆。”这种划分使得历史数字化有了可靠的哲学根据。历史学家可以对档案、文献等文本进行数字化,也可以对非文字的物进行数字化处理。但是,这种划分的不足之处在于如何处理语言这样一种形式。在历史叙事中往往存在着口述方法的采用,活着的口述者的影像逐渐成为历史研究的一类重要材料。经过数字化处理之后,活着的口述者往往以视频影像的形式呈现出来。这就带来也称为“与口述见证混淆”的这一利科曾经担忧的问题。人们往往过于关注这样一点:口述者去世之后这种影像就变成了珍贵的影像记忆材料。但这本身并不成其为问题。口述者去世,其言说影像成为珍贵的历史资料保存下来,其价值仅仅是如此。当然,可能一个更为隐秘的问题是:这样做会产生一种奇特的图像效应,口述者在若干年后看着曾经自己的言说,一种奇特的效果会产生,似乎看到的不是自己,而是一个陌生的他者。同时,就“理解/解释”本身,利科指出了历史研究所依据的“心态”概念存在着“巨大的混乱状态”,而这一切是总体史观念导致的结果,为了克服这一点,需要放弃“心态”,选择“表象”作为可能性的出路。

这本属于职业历史学家的特定活动,然而,随着历史对象的数字化普及,普通人也可以对历史进行理解和解释了。“职业历史学家”的形象变得模糊起来。这也是历史研究主体的消解后果。

其次,数字人文更要关心由大数据、人工智能导致的普遍情绪。大数据、人工智能算法等现代技术是理性形而上学的极致形式,其内在的“理性傲慢”猛然溢出,至少表现为三种形式:数字技术与算法在应用于新冠疫情上取得的巨大成就所彰显出的理性傲慢,数字技术在学术研究方法领域中的成效所彰显出的理性傲慢,以及大数据技术在社会治理方面取得的成就所彰显出的理性傲慢。

另外,数字人文可能揭示出一个新的经验形式领域:与非人经验有关的形式。我们都非常熟悉的经验形式总是与人有关。这也是解释学的关键所在,其所谈论的经验是人类经验。面对所熟悉的世界,人们很容易形成一种独特的经验类型;面对飞速发展的技术,比如虚拟现实、增强现实对象,甚至今天的元宇宙,人们也会形成一种全新的经验类型。但是在这两种情况下,经验总是人自身形成的经验。而非人经验是一种全新的经验类型,这种经验是智能体在深度学习过程中获得的。大多数学者直接排斥了“数据—经验”概念的有效性,一个最为重要的根据是智能体并不具备人类的时间性,换句话说,智能体并非时间性和历史性存在,它们无从体验到时间的流逝。但是,越来越多的科学研究呈现出一个令人惊异的成果:智能体表现出与动物相似的意识活动。如果是这样,那种哲学家自身的独断态度——直接排斥数据经验的有效性——的根据就显得有问题了。或许真实的情况是,我们无从拒绝智能体经验的形成,它或许以自己独有的方式形成,但是却具备了与人类经验的某种同构性。我们能做的,只是从规范意义上加以限定,即将数据经验作为人类经验的一种独特类型确立起来。

最后,数字人文可能揭示了一个新的本体论领域:与数字对象有关的对象领域。唐·伊德揭示了工具打开的新的实在对象,其“工具实在论”是一个重要的源头。在他看来,工具所呈现的是新的科学实在对象。在他而言,主要是指自然科学领域,比如伽利略的望远镜让我们看到的是月球表面的真实场景,特殊的海洋声音捕捉器可以让我们听到海底虾米发出的求偶声,而这些是人们以前无从知道的对象领域,尽管它们实在地存在着。这一观点无疑是有帮助的。从今天的科学成就来说,人类已经可以拍摄、合成出黑洞的照片,让黑洞呈现在人们眼前。黑洞对我们普通人来说完全是不可想象的对象,一切对象都会被黑洞吞噬,光线也不能例外,又怎么可能对其进行成像呢?然而现代科学摄影技术却实现了这一点。合成的照片让黑洞不再神秘。那么数字技术又如何?它不仅仅是忠实地再现对象的工具,还将新的存在类型加以构建呈现。比如,让数据相关因素的可视化成为可能。以江南文化研究为例,通过数字技术,即可让“莲叶何田田”的美妙江南文化意象影像化。但是,与现实对象的能够被感知特性不同,数字对象并不具备这样的特性。比如现实的桌子触摸起来我会感觉到材质的不同,一种硬度的感觉;而虚拟的桌子则是无从触摸的,即便虚拟现实技术可以实现触感的差异,但是这种差异并不能使得我能辨别材质的差异。于是,质料因在虚拟对象的分析中悄然失效。至于目的因,现实人工物对象总是有着某个特定的设计目的;但是虚拟对象在目的性上,已经看不到与原始目的的初始关联了。


5

结   语

到此为止,本文揭示了当前数字人文实践的主要特征是将人文表征物,包括文字形式(文本)以及非文字形式(物、语言、活动等)加以数字化的过程。如果聚焦在数字化本身之上,必然会出现一个可以理解的结果:充分地运用数字技术及大数据、人工智能等技术手段。这一运用的空间仍然很大,在现实生活中,还有很多的人文表征物等待着数字化。然而,仅仅停留在人文表征物和数字化之上是远远不够的。我们终究将要面对一个根本的问题:人自身以及人类的行为。可能更为紧迫的问题是意识到在这个时代,人自身以及人类的认知与行为正在为新技术塑形,个体的认知与记忆、集体的历史与文化都逐渐被数字化重构。一种非人经验与数字对象正在出现,这才是我们需要面对的事实本身。如果接受这一观念,那么看到的并不是胡塞尔式的科学危机——本是方法的东西被当作了事实本身,而是一个隐匿的技术危机:原本是方法的东西确实没有变成事实本身,但是却构建出新的事实本身。

编辑:李星玥

版式:贺谭涛

数字人文的方法理解及其反思

原文始发于微信公众号(数字人文研究):数字人文的方法理解及其反思

About the Author: DH