当前,我们每个人都深处“数字洪流”当中,虚拟空间中的数据、信息、知识乃至记忆成为时代跳动的脉搏。如何从这些纷繁复杂的数字资源中遴选并保存珍贵的时代记忆,这是全人类共同面临的议题。2021年,联合国教科文组织(The United Nations Educational, Scientific and Cultural Organization, UNESCO)发布《数字遗产长期保存鉴选指南》(The UNESCO/PERSIST Guidelines for the Selection of Digital Heritage for Long-Term Preservation)第二版,旨在为解决该议题提供参考与借鉴。下面就让我们详细了解一下吧!
发布背景:“PERSIST项目”
2012年9月,以“数字时代的世界记忆:数字化保存”(The Memory of the World in the Digital Age: Digitization and Preservation)为主题的国际会议在加拿大温哥华召开,主要聚焦于“模拟态资源的数字化”与“真实、可靠、准确数字资源的连续性访问与长久性保存”两大方面,旨在探讨影响数字遗产保存的关键问题。会上,通过了《温哥华宣言》(UNESCO/UBC VANCOUVER DECLARATION),为数字遗产领域的理论与实践发展提供指南与参考。
数字时代的世界记忆:数字化保存
《温哥华宣言》指出“迫切需要建立一个路线图,提出解决方案、共识和政策,以确保数字遗产的长期访问和可信保存。同时,该路线图应致力于解决开放政府、开放数据、开放获取和电子政府等问题。它应符合国家和国际优先事项,并完全尊重人权。”[1]以此为起点,2013年12月5日和6日在海牙举办的UNESCO国际会议正式启动“全球增强信息社会可持续性发展平台”(Platform to Enhance the Sustainability of the Information Society Transglobally, PERSIST)项目(以下简称“PERSIST项目”)。
全球增强信息社会可持续性发展平台PERSIST
UNESCO与国际档案理事会(International Council on Archives, ICA)、国际图联(International Federation of Library Associations and Institutions, IFLA)等密切合作,共同致力于推动PERSIST项目发展。其中,三个核心主题分别由三个工作组统筹领导:一是UNESCO世界记忆项目组负责“数字保存政策”(Digital Preservation Policies)主题;二是国际档案理事会负责“技术”(Technology)主题;三是国际图联负责“内容与最佳实践”(Content and Best Practices)主题。2016年3月,PERSIST项目正式成为UNESCO世界记忆项目的组成部分。
国际图联IFLA
国际档案理事会ICA
2016年,《UNESCO/PERSIST数字遗产长期保存鉴选指南》(The UNESCO/PERSIST Guidelines for the Selection of Digital Heritage for Long-Term Preservation)(以下简称《指南》)第一版问世,旨在为图书馆、档案馆、博物馆和其他遗产机构制定数字遗产长期可持续性保存的鉴选政策提供重要支撑。2021年,PERSIST内容工作组对首版内容进行修订,发布《指南》第二版。
《指南》主要针对遗产机构中日常决定哪些数字材料属于长期可利用资源的从业者。整体上包括两大部分:第一部分:数字保存对鉴选决策的影响(Part 1: The Impact of Digital Preservation on Selection Decisions),简要介绍从业者和相关人员为保存新型的、重要的文献遗产而必须制定的鉴选准则;第二部分:深入了解数字环境中的收集工作(Part 2: A Deeper Look at Collecting in the Digital Environment)。
数字保存对鉴选决策的影响
1. 界定数字保存
参考数字保存联盟(the Digital Preservation Coalition)所给出的“数字保存”定义:数字保存是指一系列必要的确保数字资源可持续利用的管理活动。它是指不受载体失效或技术和组织变革的影响,确保数字资源可访问的全部行动。这些资源可能是组织日常业务中生成的文件;为特定目的形成的“原生数字”材料(如教学资源);或者数字化项目的产物(《数字保存手册,2015年》)。
数字保存联盟
数字保存可确保对数字信息跨时间、技术和语义转换的长期访问,并具有长期效益,诸如社会效益(政府证据)、文化效益(国家认同)和经济效益(利用与再利用、创新)。
2. 制定鉴选标准
鉴选标准通常包含于收集或获取政策之中,可以基于以下方面(也可以组合):
-
职能:档案馆等文献遗产机构将根据自身或政府开展的工作选择具有长期价值的文件。例如:外交电报是外交部重要职能的产物。
-
主题:机构将关注并尝试记录一个或多个主题领域。例如,专用于特定画家或地点的网站,或用于抓取特定事件(如政治选举或艺术节)的网络爬虫。
-
形成者/来源:机构将重点关注遗产的特定形成者或来源。例如,档案馆可能获取特定地区作者生成的数字文件,博物馆可能收藏某一特定活动中艺术家的作品。
-
类型/格式:机构可以按内容的类型或格式(例如,数码照片、音乐录音、电影、视频游戏)进行收集。
3. 确定收集方法
适用于单一机构的“鉴选决策树”方法,包括四个步骤:
步骤1:识别确认
确认待获取或评估的数字材料:
-
标题、形成者、来源、范围、状态是什么?
-
机构是否有能力和权利来捕获、保存所有数据/文件/信息并提供利用?
-
可用的元数据种类和数量?如果元数据已损坏,如何解决?
“确认”可否在比数字对象本身更高的层次上进行?有否指导鉴选决策的职能或活动?例如,政府档案馆可能决定不去获取行政活动中形成的任何文件,因为它们均已通过高级别政策工具和支持总体决策的文件得以充分记录。
步骤2:法律框架
确定与数字资源长期保存相关的法律问题:
-
机构是否保存相关资源的法律义务?机构关于数字保存和馆藏资源建设的任务或政策是否要求保存相关数字资源?
-
是否考虑过保存的潜在障碍(比如知识产权或隐私限制)?
步骤3:鉴选标准的应用
如需进一步鉴选,机构可以依据三项要件评估数字资源:重要性、可持续性和可用性。通常从易到难,直到达成最终决策。
(1)重要性
-
数字对象的价值在多大程度上支持和吻合机构的使命和任务?
-
数字对象系原生性数字资源还是实体的替代物?实体是否仍然存在?
-
对机构服务的对象、形成者所在的社群或全人类来说是否具有重大的社会、文化、历史或艺术价值?
-
是否含有重要的信息、内容?是否具有利用或研究价值?
-
数字对象如果不予保存,对机构的利益相关方(客户、赞助商、社会)会产生怎样的影响?
-
文献遗产是否由土著社群或代表性不足的社群形成或关乎他们?如是,与这些社群的协商应列入鉴选流程。
(2)可持续性
-
机构是否有足够的基础设施来保存数字遗产?如果没有,有否确保资源可持续性的应急方案?
-
机构是否具有理解、迁移和保存数字遗产的技术能力?
-
将资源传输或迁移至不同文件格式、物理载体是否需要特定权利?
-
是否有足够的元数据用于访问和保存数字遗产?
-
数字资源的格式是适于保存还是应予迁移?
-
机构能否将资源用于研究、展览或其他用途以满足公众的期望?
(3)可用性
-
机构是保存该资源的唯一主体还是其他机构存有精准复本?对全宗或整个机构的馆藏有否影响?是罕见的、独特的还是已被广泛复制?
-
保存在哪里能够被广泛利用或对公众最为有利?
-
保存在其他机构是否面临风险?
-
是否确系最适合保存该数字遗产并提供利用的机构?
-
切记一定数量的备份对于确保数字遗产长期保存的必要性。
步骤4:决策
汇编和审查上述过程中的所有记录,并根据步骤1至3的审定结果作出决策。这种方法是灵活的,并非每个问题都适用于所有机构,评估流程的顺序也并非一成不变。
准备一份关于数字遗产重要性、形成背景以及技术保存问题的书面声明,包括步骤1至3中所列问题的答案。支撑决策的论据往往比评估本身更为重要。应创建评估表或鉴定文件的规范模版,记录这些论据,使其成为决策依据。
深入了解数字环境中的收集工作
(1)图书馆
大英图书馆
图书馆势必面临电子出版物、网站爬取以及Facebook、YouTube等社交媒体网站专有内容的数字鉴选挑战。传统环境中通常由编辑决定“出版什么”,相比之下“自主出版”和“电子书”的出现营造了一个更加多元的环境。面向长期保存的数字遗产鉴选,“如何选择出版物”“选择怎样的出版物”,这些成为图书馆需要解决的重要命题。
无论规模大小,大多数图书馆都将受益于根据记忆机构之间共享的相似价值观来编制数字鉴选的流程、制定数字鉴选标准。这将有助于图书馆确认可能属于其长期保存任务范围的数字资源类型,以避免资源的重复建设和遗失消亡。
(2)博物馆
澳大利亚博物馆
博物馆拥有丰富且多样的物质文化藏品。随着这些物质文化藏品逐渐数字化(例如,由计算机软件驱动的机器、原生数字艺术品、考古遗址的数字记录等),数字保存的压力与挑战也随之而来。
博物馆中的数字遗产可以分为以下几类:原生数字物品、馆藏数字或数字化信息,以及文物的数字呈现(例如数字图像或3D扫描)。基于上述分类,博物馆通常应优先考虑对第一类和第二类进行长期保存。此外,元数据(关于实体遗产和数字遗产的信息)对于博物馆资源建设来说至关重要。
(3)档案馆
英国国家档案馆
档案馆在对采集到的进行鉴定时,尤其关注其真实性(authenticity)、来源(provenance)和背景信息(context)。相关法律通常规定了档案馆必须获取哪些数字信息,以及如何、是否允许公众访问和研究这些信息。在某些情况下,公开授权的原生数字材料的大规模存档,赋予了档案馆新的社会角色。
然而,由于数字格式很容易过时,加之文件和数据形成者无法实现对信息、存储载体以及软硬件系统的维护,这一切使得鉴选活动面临挑战。越来越多的档案馆开始尽可能更早地收集原生性数字文件、社交媒体、网络软件、人工智能以及其他形式的重要数据,通过与文件形成者、信息技术专家、数据科学家及其他利益相关者建立密切的工作关系,以确保文件和数据形成过程中的完整性,并在信息传输之前就对其进行维护。适当的前端介入必不可少,因为文件和数据的形成方式将影响后续对其的获取、保存和利用。
档案馆之间,差异悬殊。但即便预算不足、容量有限、基础设施匮乏,也不能免除档案馆保存数字资源(文件、数据等)的职责。现有的许多成熟度模型不仅可以帮助档案馆评估其能力水准,还可帮助确定切实可行的发展路线图,充分利用可用资源。
数字时代,“信息爆炸”相伴而来的是“信息骤失”。然而囿于有限的资源与精力,加之“不可控的”和“难以计量的”信息输出,很少有机构能够对这些信息资源进行全部采集和保存。这就是数字时代的选择悖论。
如何在瞬息万变的信息光影中捕获最珍贵、具有重大价值与意义的数字遗产是全人类尤其是遗产机构面临的时代命题。图书馆、博物馆、档案馆因其保管对象的差异性而表现出不同的侧重点,多元出版物、数字文物与文物数字化、对文件形成阶段的前端控制分别成为三者关注的焦点。基于什么标准、依照怎样的流程对纷繁复杂的数字资源进行鉴选,正是《数字遗产长期保存鉴选指南》旨在回答的关键问题。然而,《指南》并非万能公式,也不一定完全适用于各国实践。以《指南》为依据,探寻适合本机构、本领域、本国或地区的数字遗产鉴选标准与流程才是解决之道。
★
一键获取《指南》原文:
参考文献:
–已经打不开的人人网是否属于数字遗产,值得保存吗?
–儿时的哪些电子游戏已经无法获取,属于数字遗产么?
–您认为应该怎样定义数字遗产?想到的更多实际案例?
–图书馆、博物馆、档案馆在数字时代面临的共同挑战?
撰文:郭若涵
图片:网 络
编辑:刘思良
原文始发于微信公众号(档案那些事儿):国际视野|图书馆、博物馆、档案馆如何迎接数字挑战:联合国教科文组织发布《数字遗产长期保存鉴选指南》(第二版)