专业资讯丨CBDB数据分析方法介绍

人物传记

“人物传记”研究是对历史人物的共同背景特征进行整体性调查分析。在开展研究的时候,我们首先需要建立起一个研究域,然后提出一系列共通的问题——如关于出生和死亡、婚姻和家庭、社会出身以及继承的经济地位、居住地、教育情况、个人财富状况和来源、职业、宗教信仰、官场经历等等;然后将研究域中的各类人物信息结合起来,探索关键变量。在对这些人物信息进行分析时,不仅需要考虑信息的内部联系,还要考虑这些信息与其他行为举止之间的关系。


GIS:映射与分析

使用CBDB数据进行人物传记研究时所遇到的挑战之一,就是如何探索海量数据中隐含的数据模式。对于这个问题,我们可以使用统计软件,也可以使用地理信息系统(GIS)软件。中国历史GIS(CHGIS)项目对公元前221 – 公元1911年间的行政系统以及1820 – 1911年间的重点非行政城镇建立了数据集,免费对外开放。我们使用ArcGIS或MapInfo(甚至GoogleEarth)这样的GIS软件,可以将CHGIS数据集与CBDB的输出结果进行合并。


下文对CBDB数据之间的相互关联和映射到GIS软件中的方法进行了说明。


当我们向CBDB数据库发送地理空间查询请求时,可以选择输出为适用于GIS软件的格式。输出的文本文件(.txt)会包含查询请求中所有地点的x/y坐标以及地点的数量。例如在下面这个查询中,用户希望知道在CBDB的数据库中有哪些人在1127 – 1199年间考取了进士。然后他将CBDB输出的数据导入GIS软件(添加.txt文件作为一个“x/y事件”)。数据显示出来后,用户借助GIS软件就可以看到这些人物的数量和位置。


专业资讯丨CBDB数据分析方法介绍


从上图可以看出,那个时期考取进士的人集中在浙东和浙西、福建、江南地区的东西部以及成都周边。接下来,用户想要进一步知道这一分布规律在南宋最后的75年中是否发生了变化。


专业资讯丨CBDB数据分析方法介绍


从上图可以看出,考取进士的人的地理分布在逐渐缩小。因为CBDB会重点显示政府要员的信息,因此用户又希望了解这一分布模式是否具有普遍性。在CBDB的数据库中存有两份完整的宋朝进士数据,一份是1148年的进士数据,一份是1148 – 1256年间所有宋朝进士的数据。将1148年的数据与整个宋朝进士的地理分布及数量分布情况进行对比,得到下图:


专业资讯丨CBDB数据分析方法介绍


我们可以看出两者的空间分布具有一定的相似性,但也存在不同,有些是预料之中的,有些则是预料之外的(没有预料到的是四川盆地东部的人数增多了,而现在浙江东北部的进士人数减少了;预料之中的则是在失落之都开封拥有正式户籍的人数会有所不同)。


其他向CBDB发送的查询请求也可以选择以可应用于GIS的格式进行输出。下面几个例子展现的是不同类型的社交网络。第一个例子(下图)显示的是北宋元祐(1086 – 1093)和元符(1098 – 1100)统治年间试图推翻王安石“新政”的“旧党”官员分布情况。制作这张图是为了研究新旧两党的官员是否来自于同一个地方。


专业资讯丨CBDB数据分析方法介绍


在GIS软件中,所有支撑可视化显示的数据都是可查询的。从下面这张图中,我们可以看出党派成员的家乡分布,我们还可以进一步查找元符年间来自福建邵武的党派人员都有哪些。对于本文所举的例子,我们可以通过查看数据信息,获取更多有关地图上某个位置的信息。


专业资讯丨CBDB数据分析方法介绍


第二个例子展示的是婚姻网络,只要给定一个人物或一个家族,CBDB就可以输出对应的社会关系网络。在下面这个例子中,我们对北宋政治家司马光和南宋政治家史浩的婚姻网络的空间范围进行了对比。


专业资讯丨CBDB数据分析方法介绍


第三个例子是吕祖谦的非亲属社交关系网络。在这个例子中(下图),我们希望对社交关系中的一阶、二阶和三阶关系进行区分。


专业资讯丨CBDB数据分析方法介绍


在最后一个例子中,我们利用GIS程序对CBDB的数据和来自其他CHGIS数据源的信息进行了整合。这里我们想要探讨的是北宋期间的商业活动,例如1077年关税定额的高低,与当地中举人数多少之间是否存在明显的关联性。


专业资讯丨CBDB数据分析方法介绍


社交网络

L. Stone认为,社交网络分析(SNA)为以事实研究为基础的人物传记研究提供了新的思路。Charles Wetherell是这么写的,对个人关系集合的概念化……相当于为历史学家绘制了一幅蓝图,让他们可以对历史人物维护亲属和非亲属关系的时间、方式以及原因进行考察。社交网络分析学家分析发现,人们需要并且会主动寻求不同类型的情感和经济支持,同时也需要并且会从不同类型的人那里寻求情感和经济上的支持,这就形成了新的研究需求。如今仅仅探究人们在危急时刻如何借助亲属关系已经难以满足研究需求了。历史学家需要探求的是历史人物在面对不同的情形时是如何借助亲属和朋友的力量的,当他们碰到人生中的大机遇时,当他们受到人口和文化所带来的束缚时,又是如何反应的。通过其他的研究方法确实也可以研究这些问题,但是HSNA(历史社交网络分析)所能带来的研究视角是必不可少的。在这些视角下进行研究不仅能够推进不同观点的发展,也能够帮助历史学家应对Tilly提出的挑战,以有意义的方式将普通人的生活与大环境的变化联系起来。


CBDB针对所有社交网络查询请求所输出的单一视角数据都可以进行可视化分析,也可以通过Windows环境下的社交网络分析软件Pajek进行分析。可以搜索“Exploraotry Social Network Analysis with Pajek”这本书作为Pajek的用户手册。在Windows环境下也可以用UCInet软件分析Pajek文件,它的分析能力更强。


下面这个例子是朱熹一代的453位新儒家学者之间相互传递的2, 717封信件的可视化网络分析图。


专业资讯丨CBDB数据分析方法介绍


通过对上图的进一步优化,我们可以从中筛选出至少与两人进行过互动的人物,如下图:


专业资讯丨CBDB数据分析方法介绍


也可以用节点的大小反映人物所写信件的相对数量多少,如下图:


专业资讯丨CBDB数据分析方法介绍


在下面这张图中,两个节点之间的连线代表着两人之间信件来往多少的情况。


专业资讯丨CBDB数据分析方法介绍


利用Pajek软件,我们可以对人物间关系的类型或远近程度进行标注,如下图:


专业资讯丨CBDB数据分析方法介绍


我们也可以描绘出不同时期下当地社交网络中的亲属关系,并进行比对。


专业资讯丨CBDB数据分析方法介绍


上图显示的是1050 – 1100年间福建莆田地区中考取进士的人的一阶亲属关系网络。


专业资讯丨CBDB数据分析方法介绍


上图是1200 – 1250年间福建莆田地区中考取进士的人的一阶亲属关系网络。


最后,我们还可以利用GIS进行社交网络分析。下面这张图(由Adam Mitchell和Darius Li提供)将CBDB中某一代人的居住地密度分析图与来自这些地方的人之间的社交网络关系强弱分析图结合了起来。CBDB的网站上对如何制作这种分析图有详细的步骤说明。


专业资讯丨CBDB数据分析方法介绍

以上信息来自CBDB官方网站: 

https://projects.iq.harvard.edu/cbdb/methodology

经数字人文资讯小编翻译整理而成

未经许可请勿转载

编辑 | 木沉路

专业资讯丨CBDB数据分析方法介绍

原文始发于微信公众号(数字人文资讯):专业资讯丨CBDB数据分析方法介绍

About the Author: DH