【陈 涛】中文百科概念术语服务平台 SinoPedia 的 构 建 研究

thumbnail of 中文百科概念术语服务平台SinoPedia的构建研究_陈涛

摘 要 随着“数据的网络”的兴起,万维网的内容已不再是纯粹的文本,而是表达和模拟多种事物及事件之间 相互关系的实体集合,其中实体名称、属性及取值词表的规范十分重要。国外已形成覆盖广泛的“关联开放数据 ( LOD) ”服务。中文概念术语的缺乏已严重阻碍中文知识图谱和中文领域本体的标准化和推广应用。本文提出 的 SinoPedia 平台采用 RDF 三元组对目前公共领域的百科概念术语赋予唯一的 URI 进行资源的持久化,并通过 SOOOPA 模块提供检索服务。同时,自建的资源词条已与 DBPedia、WikiData、上海图书馆人名规范档等多个开放 资源做了实体关联。除检索服务外,SinoPedia 还提供了关联数据发布服务,可以充当关联数据发布中心( Hub) 。 通过扩展 LODVIEW 系统为不同关联数据站点( SPARQL Endpoint) 提供统一的关联数据发布和内容协商服务。 此外,SinoPedia 集成了 LODLIVE 系统,能够实现不同数据集之间关联数据的发现与融合。目前 SinoPedia 包括了 554 万条三元组数据,并提供 API 接口和 SPARQL Endpoint 两种数据调用方式,下一步将申请接入 LOD 云图。 SinoPedia 将来可以作为数字人文领域的数据链接中心,推动数字人文研究的快速发展。图 7。表 3。参考文 献 20。

关键词 SinoPedia 关联数据 知识图谱 数字人文 知识发现

About the Author: DH