CBDB | 数据库中的核心实体——地址

CBDB 

在上期中,我们介绍了CBDB数据库中的核心实体“职官和除授“,今天,我们继续介绍同样被列为核心实体的“地址”。

 /


地 址


CBDB使用“中国历史地理信息系统”(CHGIS)的方法来给地址编码,这种策略依靠空间实体:“地址”。


△ 图为CBDB中传主的地理分布


“地址”这一实体,是有地址的历史“场合”——空间中有特定名称的行政辖区。其位置由x、y座标的交汇点来确定。如果其边界或者名称中任何一个改变,就要建立一个新的地址。然而,这些历史场合是行政层级的一部分:这些资讯都保存“belongs-to”表格中,这张表格和CHGIS中的“part-of”表格功能相同。某一区域只有面积或名称发生改变时,地址ID才会变化,当其成为别的上级行政区的一部分时,地址ID并不发生变化。因此,CBDB中有两张表格:


地址表

地址代码

地址名称

行政类别

X座标

Y座标

地址始年

地址终年



从属表

地址代码

从属地址代码

从属始年

从属终年


从这两个表格CBDB生成了一个便利的地址表格,在网上数据库使用,可以在独立版本中查询以提供关于行政单位在官僚结构中的角色的资讯。它的结构是:


地址代码

地址名称

地址始年(地址属于优先顺序地址)

地址末年(地址属于优先顺序地址)

行政类型

X座标

Y座标

从属1(根源:它所述职的更大的行政单位)

从属2(根源的根源)

从属3(其他)

从属4

从属5


CBDB的一项主要目标是允许考察跨越朝代的变化趋势,因此数据库需要一种方法检索在较长的一段时期内某个特定区域发生的事情。CBDB依靠“地址”实体实现这一要求:地址指向一个物理位置,即地图上的x-y座标。郝若贝教授在他的原始数据库版本中共置了对应的历史地区(或郡、县)及1990年的地区边界。然而CBDB已不再使用易产生误解的边界,而是使用图心,即多数边界等距点,作为点的x-y座标。


总之,CBDB有两张表格构成了部分对地址的基本描述:

行政单位:ADDR_CODES

行政层级:ADDR_BELONGS_DATA



未来发展的思考


CBDB地址表中的地址具有特定的起始年和终止年。对于一个历史数据,我们可能不知道一个人在其所在地的时间。目前CBDB增加了临时代码来处理这种历史不确定性。有时,历史信息面临着更基础的不确定性:有时我们知道一个人的所在地名称,但该名称的地址不止一个。很快,CBDB会将现有的地址代码整合为三个地址代码:


地址名称代码

地址位置代码

地址实例代码



因为地址名称有历史延续性,因此有些地址有同一个名字。这些重复的名字在历史中或多或少地重现,尽管有略微改动。因此地址位置代码可识别大致出现在同一地址的历史名字。例如,湖南,陕西,山西和广东四个地区都有名为“宁远”的县,每个地区都有对应的地址代码(湖南有三个,陕西有四个,山西有四个,广东有五个)。地址实例代码将区分同一地区有不同地址代码的行政地区。


如果您希望更详细地了解中国历代人物传记资料库(CBDB),欢迎登录www.inindex.com注册使用。





本篇文章来源于微信公众号:引得数字人文平台

About the Author: DH