相知与定名:人工智能(AI)时代的图像、文献与历史

编者按:近年来,关于图像与历史史料的研究与探讨一时风生水起。图像资料与纸上遗文的互相释证,也激发了“图像证史”的观念和理论。就图像史料而言,可分为相对客观的美术图像和图像作品所反映的时代景观,而将时代景观作为历史事实证据时,但存在着很多或明或暗的陷阱。在运用图像文献时,需要通过“移情”,参照一般逻辑和人情理路来帮助理解古人;也要避免“矫情”,带着自身立场和知识背景造成故作高深的解释。在分析图像时,要分析持续的景观和制造中的景观、给人看的图像和不给人看的图像、图景的观众和图景的参与者等诸多因素。如此,历史研究才不会只停留于屏面的文献检索、纸面的文本解读,而应结合由物、象及人的遗物考察,兼重以场、迹及事的遗迹调查,最终在还原历史叙事之真相的同时,复原历史景观之原貌。在新时代,人工智能(AI)新技术的出现和介入,对图像史料分析和解读可以得到更好的应用,但在多大程度上可以讲述历史事实、与现有的文献材料如何互相生发,以及剔除模糊不准确的成分,成为需要进一步评估和思考的话题。本期就图像与历史关系所做的一些讨论,旨在抛砖引玉。

相知与定名:人工智能(AI)时代的图像、文献与历史

秦 蓁

从傅斯年提出“史料就是史料学”,到宫崎市定“历史是什么?更具体地说,就是有什么样的史料的问题”,让史料来讲述史实既成共识,使用什么样的史料和如何使用史料,就变得尤其重要。在深度搜索、广度搜索使得大数据集中成为可能的背景下,应用计算机技术检索史料、收集信息,使得对史料的获取和把握与传统考据学时代大为不同,业已带来史学方式的革新。关于E考据,自黄一农标举其定义以来,已为习用之词。不过,E考据毕竟还是以人的智力和学力为主导,占有、阅读与查考文献资料的环境,或因海量的检索系统而发生改变,究其本质,与传统的考据并无冲突。而今人工智能(AI)时代俨然到来,颇有科学家预言云,很多的职业会被取代、今天学的东西很可能要被人工智能(AI)替代,那么究竟什么是人工智能(AI)?人工智能(AI)可以算是E考据的升级版吗?

 

 

关于什么是人工智能(AI),学术界原有非常严格的定义;一直在各种场合为推动公众对人工智能(AI)的认识的洪小文博士则提出,一切可以用计算机实现的事情都可以称之为人工智能(AI),只要是一个好东西,能被机器实现,就是人工智能(AI)。信息科技发展至今,无论从记忆还是运算能力看,人脑都再没可能赢过电脑。按照图灵提出的假设(Church-Turing thesis),任何可以被计算的东西就可以用图灵机去算。我们应该想一想,究竟哪些是可以用算法去描述的?如果一旦可以被算法描述,AI有可能代替我们思考吗?在历史研究领域,人工智能给人类的智慧留下余地了吗?

人工智能是一个非常广泛的领域,涵盖很多学科,本文所探讨者,限定于在历史研究领域中图像材料与文字材料的应用,所涉及的范畴则暂限定为计算机视觉(包括模式识别和图像处理)与自然语言理解与交流(语义识别)。

视觉系统是我们大脑当中最为复杂的系统,大脑中负责视觉加工的皮层占所有皮层的 50%。人类拥有的强大的视觉系统,使我们在睁眼的一瞬间就能毫不费力地感知并理解自己所处的空间环境;在150毫秒之内,我们的大脑能够把非常复杂的含动物和不含动物的图像区别出来。而机器视觉是人工智能领域的传统难题。2012 年,卷积神经网络(convolutionary neural network)和 GPU(图形处理器,Graphic Processing Unit)技术出现之后,除物体识别之外的关系识别、复杂语义表征和场景图景的构建已经渐有雏形,然而,主要解决方法至今仍采用绕开视觉的策略:例如在无人驾驶领域,目前对环境的感知主要是通过雷达和各类传感器获取周围空间信息的方式加以实现的,由此避开了从二维视觉图像还原三维空间的棘手问题。

而与视觉系统相比,人工智能的语义学研究更为薄弱。语言产生的基础是人类希望通过对话达成沟通、形成共识,对于在人工智能的研究中至关重要的语义自主学习和反应能力而言,我们需要为智能机器的程序寻求建立一种在具体语境中确定和“发现”语言意义的机制。1948年提出信息论后,这个领域始终没有什么大的突破。其原因正在于句子或者命题的意义不是固定的、一成不变的,而是会受到语境的强烈渗透和“感染”,这就对于人工智能的“意义”理解功能提出了更高的要求。人工智能对于人类心智意向性的模拟已是重要课题,然而计算机获得主动展开语境信息判断、进而在其内部结构系统之中对于语境相关信息进行有效的处理、并且将这种处理的结果反馈于与其存在语境的互动之中的能力,迄今没有乐观的成绩。

笔谈 | 相知与定名:人工智能(AI)时代的图像、文献与历史

 

 

从生成式模型的角度来看,语言就是视觉,视觉就是语言;艺术史中的视觉图像与语言文献,可以因为人工智能(AI)的介入而得到更好的应用吗?如果说在E考据时代,机器曾经替代我们的体力,让我们能够不皓首穷经而占有更多的材料,从而分析其间的联系;那么人工智能(AI)可以通过深度学习来替代我们的智力吗?举二个例子。一个例子用以说明大批量的图像,可以对学术研究所做的推动,而此部分图像,如果能有大量数据建成的数据库作为支撑,人工智能(AI)的推导分析能力,应不在人类学者之下;另一个例子则用以说明即使图像数目足够,跨领域的数据检索亦已经实现,若非调动各方面的知识储备,结论依然落在天际之外。

第一个例子,是有名的兰亭论辩。1965年的兰亭论辩中,郭沫若以新出土的《王兴之墓志》撰文否定《兰亭序》,挑起了热烈的论争;时隔多年,1972年,郭沫若再写成《新疆出土的写本〈三国志〉残卷》,根据晋写本《三国志》是隶书体,得出“天下的晋代书都必然是隶书体”的结论,并以此来证明《兰亭序帖》为伪。1973年《考古》第四期刊登南京博物馆清理溧阳果园东晋墓的报告也说“东晋的书法基本上还是隶书”。这样就提出了晋代书法是否都是隶体的问题。

之后的不同意见,主要还是集中于不同场合要用不同书体的观点。这在逻辑上当然是对的。不过,囿于当时材料的有限——多用碑版文字中的楷意来作为佐证,如《颜谦妇刘氏墓志》《夏金虎墓志》《贾太妃墓志》等,实物证据到底尚嫌不足。这是受材料条件的限制。晋代文献中,能作为基本资料的遗物原本就比较少,虽然所谓的晋代法帖大量流传,但其制作却是由宋代开始的,纵然双钩刻字技术非常出色,但毕竟经过双钩和刻字两道程序,形貌必然失真。从20世纪初期以来,赫定、斯坦因等人从楼兰、敦煌等地获得的晋代木简残纸墨迹,可以对以前只依据书法史上传说性文献来讨论的一些问题进行充分的订正。西川宁《西域出土晋代墨迹的书法史研究》,以此为基本材料,得以大量列举了东晋时的出土书迹,认为更能显示东晋的本相。大致而言,以各书体笔画的笔法,到各字体,乃至分间布白为对象,进行绵密的比对分析,对书体断代提出了自己的见解,如其采用《李柏文书》和《张超济文书》,认为此与王羲之前期作品《姨母帖》《行穰帖》《瞻近帖》相似,很有说服力。

要指出的是,西川宁所采取的分析法, 人工智能(AI)或有一天能够完成。因为他所采用的局部特征判断法——字符行的对齐程度、字符的偏斜度、文字的布局、字符之间的连接情况、笔画的连续性、字符的终端笔画的属性等——是有规律可循的。当某项任务被定义得足够清晰时,该任务便为技术上可完成的。如果在数据库中有如前所举的东晋出土书迹,令人工智能(AI)对局部特征进行分析,晋代书体并非滞留于隶体的结论昭然若揭,而晋代书法从第一期继承汉代而来的波势、笔画多覆势,到第二期覆势和右回转笔画中渐混入直线性,整体的波势有所收敛,再到第三期波势的几乎消失,而这种波势在之后的楷书中基本已经被扬弃——以“波势”的消长作为断代依据之一,对数据库中的书迹进行分门别类——人工智能(AI)应能胜任愉快。

更进一步,我们应该承认,通过对图像的分析来形成对风格的判定的过程,其实就是用脑皮层里面学习到的大量的知识来解释所看到的“蛛丝马迹”,形成一个合理的解释的过程。大数据的平台,能使得我们有机会看到更多的“蛛丝马迹”;然而,怎么保证“蛛丝马迹”不从我们眼皮底下溜走?此外,我们往往对有些变量非常敏感,而忽略其他一些变量,强化学习的算法,会能够跳出窠臼,在人类的盲点处看到其他的“蛛丝马迹”吗?此个案中,以图像为基本资料库,不断地告诉计算机什么样的笔法对分析特征风格才具备意义,即用大量任务、而不是大量数据来塑造智能系统和模型,或可作为“小数据、大任务(small data for big tasks)”的范式样本。

另一个例子是扬之水《掬水月在手,弄花香满衣——一个装饰纹样的传播史》。关于这个美丽的句子,大约有三种形态的存在。一是纯粹的文献。唐人于良史《春山夜月》诗云“春山多胜事,赏玩夜忘归。掬水月在手,弄花香满衣。兴来无远近,欲去惜芳菲。南望鸣钟处,楼台深翠微”。此文献的衍变,遂有南北宋之交的女诗人朱淑真《掬水月在手》和《弄花香满衣》之分题吟咏。再之后的诗题进入元曲,如马致远所作套数【仙吕·赏花时】之有《掬水月在手》与《弄花香满衣》二题。其二是此文献与艺术作品,包括绘画与器物的简单结合,所谓“简单”,就是在艺术作品上直接出现诗句。这里就又可以分梳为两种情况。一种是在实用器物上出现有诗句。深圳博物馆有一件金代红绿彩诗文碗,碗心所书“掬水月在手,弄花香满衣”;河南延津沙门古黄河渡口城址出土的一件白瓷碗,碗心墨书相同的诗句。另一种是在图画上出现诗句。明代谢承举有《掬水月在手画屏》诗,图今不传,而此题画诗则留了下来。第三个方式,则是以此诗句意境为表现宗旨,通过绘画或者器物,来传递此诗句的所指。台北故宫博物院所藏的《浣月图》,所掬之水是来自矮石台上的方鉴;上海博物馆所藏《金盆捞月图》,则是椭圆的盆,一轮圆月映在手中。器物则如湖南株洲攸县丫江桥元代金银器窖的金银脚簪、江苏武进前黄明墓出土的金簪,都是在方寸大小的金片上以凹凸效果的图案表现这一场景,金盆与装束、抬头望月的姿态,种种细节的安排,都显示出对这一意境的追求和延续。

而这仅仅还只是第一个层次。第二个层次,则是从“掬水月在手”的图像表现力,到发现与它一同出现的“弄花香满衣”亦如是;而又由“弄花香满衣”,勾连出“惜花春起早”“爱月夜眠迟”这一组句子乃为一个整体。依然是三种方式。第一是单纯的文献,元代郑奎妻的组诗《掬水月在手》《弄花香满衣》《惜花春起早》和《爱月夜眠迟》,凑为一组而专咏闺阁故事。《金瓶梅》写爱月儿房间里的布置,则谓有“四轴美人,按春夏秋冬:惜花春起早,爱月夜眠迟,掬水月在手,弄花香满衣”,这是从文献中来表明有此图像的存在。第二是图像化的直接呈现。作者举出赵孟頫《玩花仕女图》、唐寅《牡丹仕女图》为证,以为此画意正从“惜花春起早”翻出。更直接的则是剪纸,元岑安卿《题张彦明所藏剪纸惜花春起早图》,则直接点出此以诗意图而成为剪纸中的流行图案。相应实物的证据尚有数例。镇江博物馆即藏有宋金时代的红绿彩瓷碗,碗心所存完整之句“爱月夜眠迟”,另一句残存“起”字,因推测此句当为“惜花春起早”。常州博物馆藏明代龙泉窑青瓷大碗,碗心模印四美人,其左侧为诗句,正题此四句。上海黄浦区求知中学明墓出土青瓷花碗,亦题此句。第三则是由之前图文相配的构图因素,推知其他虽无直接诗文在侧作为旁证,但从构图元素和意向表达来看,亦可一体同视。这里举出的例子是故宫藏明正德“青花庭院仕女图叠盒”、台北故宫博物院藏宣德款宫廷用具等。

在以上的两个层次和不同的呈现形态中,我们可以推想,如果在数据库中搜索,我们可以找到“掬水月在手,弄花香满衣”原始文献的出处;在数据库的跨学科整合实现的前提下,我们亦可以检出绘画和器物上写有此诗句的相关材料;再进一步,在图像识别技术成熟的前提下,也许绘有相似构图特征图案的器物亦可被归为一类——我们暂不讨论界定“局部图像特征”的难度;设如以上的技术性问题都已经解决,从“掬水月在手,弄花香满衣”到把《掬水月在手》《弄花香满衣》《惜花春起早》《爱月夜眠迟》作为同一组意象来整体解读,以及把所呈现的意象和这一组程序化的图式拼缀关联起来,这种互证,则非人类想象力的介入不可以办到。当图像成为史料,探讨在多大程度上可以讲述历史事实、与现有的文献材料如何互相生发,以及剔除模糊不准确的成分,遂成为有趣的话题。

笔谈 | 相知与定名:人工智能(AI)时代的图像、文献与历史

 

 

对于过去世界的认识,我们主要是通过语言——文献是一种语言,图像亦是。20世纪六七十年代,哲学和社会领域出现了“语言学转向”理论范式,其后遂有“图像转向”的理论构建,在理论层面提出图像与语言表征之差异值得重视。这里补充一句,本文所涉“图像”,注重的是其作为“视觉史料”的身份,包括造形、绘画、各种实物、铭刻文书、遗迹遗址、古建民居、地图、历史照片、各种古代文书等类。人类的进化过程中,语言的出现是一个非常重要的里程碑。《人类简史》里的观点是,人类演化的某个阶段,出现了用语言传播事实上不存在的东西或者想法;《三体》里的假设是,外星种族最难理解人类的一点就是“想”和“说”的不一致。鲁白教授曾经列过一张表,在他看来,记忆、概念、规则学习、逻辑分析,都是人工智能(AI)迟早能实现的,而想象、故事、情绪,人工智能(AI)则也许永远不能做到。

笔谈 | 相知与定名:人工智能(AI)时代的图像、文献与历史

对于类围棋智力游戏,AlphaGo Zero是一个重要的结论性工作:部分地解决了超大状态空间搜索的难点;证明了基于蒙特卡洛树搜索的强化学习的有效性。人工智能的发展史,就是人类各种智能行为被机器复现并超越的历史。不过,如前所述,在以图像和文献为基础的历史研究中,机器并不能全面超越人类。略言之,对纯图像构成的历史的解读是人工智能(AI)的长项,作为数据的〈输入,输出〉对被定义得清楚,搜索空间相对完整,图像以套式(style)分门别类,这种套式就是一种固定的表达手法、固定的搭配组合,一旦确定,就非常明确,可以作为规律来理解。而在另一方面,如果引入语言文献的参数,即使文字数据库与图像数据库实现了跨学科的整合,文献、实物、图像的契合与重逢,恐怕人工智能(AI)并不能胜任圆满——无他,文法都有例外,其规则不仅相当之多,而且很多情况下这些规则并不对所有情况都适用,无法规约成搜索问题;对不确定性的处理则是人工智能领域一大难点问题。钱钟书讨论王羲之的书札的时候,有谓“一家眷属,或共事僚友,群居闲话,无须满字足句,即已心领意宣;初非隐语、术语,而外人猝闻,每不识所谓。盖亲友交谈,亦如同道同业之上下议论,自成‘语言天地’。彼此同处语言天地间,多可勿言而喻,举一反三”,这里的“心领意宣”,正是象外之意,也正是系表之言,或可谓“定名容易,相知实难”。

【秦蓁:《相知与定名:人工智能(AI)时代的图像、文献与历史》,《学术月刊》2017年第12期。为了适应微信风格,删除了注释,请见谅。】

始发于微信公众号:学术月刊

About the Author: DH