最新公布的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》在第五篇“加快数字化发展 建设数字中国” 第十七章“提高数字政府建设水平”的第一节中提出要:“加强公共数据开放共享”,具体内容如下:
建立健全国家公共数据资源体系,确保公共数据安全,推进数据跨部门、跨层级、跨地区汇聚融合和深度利用。健全数据资源目录和责任清单制度,提升国家数据共享交换平台功能,深化国家人口、法人、空间地理等基础信息资源共享利用。
扩大基础公共信息数据安全有序开放,探索将公共数据服务纳入公共服务体系,构建统一的国家公共数据开放平台和开发利用端口,优先推动企业登记监管、卫生、交通、气象等高价值数据集向社会开放。开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用。
此前,党的十九届五中全会通过的《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》已提出要扩大基础公共信息数据有序开放,建设国家数据统一共享开放平台。
2007年12月,30位开放数据倡导者首次提出了数据开放的8项基本原则:完整的、一手的、及时的、可获取的、可机读的、非歧视的、非专属的、免授权的。
|
除非涉及国家安全、商业机密、个人隐私或其他特别限制,所有的政府数据都应开放,以开放为原则,不开放为例外
|
|
开放从源头采集到的一手数据,尽可能保持数据的高颗粒度,而不是开放被修改或加工过的数据
|
|
对数据进行合理的结构化处理,使之可被计算机自动处理
|
|
数据以非专属格式存在,从而使任何实体都不能独占和排他
|
|
数据不受版权、专利、商标或贸易秘密规则的约束,除非有合理的隐私、安全和特别限制。
|
《联合国电子政务调查报告》将开放政府数据定义为“主动在网上公开政府信息,使任何人都能不受限制地获取、再利用和再分发”。
根据世界银行的定义,开放数据是“能被任何人出于任何目的不受限制地进行自由利用、再利用和分发,并最大程度保持其原始出处和开放性的数据”。
世界银行的开放定义(The Open Definition)指出,“开放”意味着任何人都可以出于任何目的自由地访问、使用、修改和共享数据。“开放性”应具备两个维度的特性:一为技术性开放,即数据应为可机读、非专属性的电子格式,从而能被任何人使用通用、免费的软件获取和利用。数据还应被置于公共服务器上供公众获取,不设密码和防火墙;二为法律性开放,即这些数据必须被置于公共领域,或处于自由利用条款下,受到最低程度的限制。
2015年,《开放数据宪章》将开放数据界定为具备必要的技术和法律特性,从而能被任何人、在任何时间和地点进行自由利用、再利用和分发的电子数据。该宪章还提出了政府数据开放所应遵循的六大原则:第一,默认开放;第二,及时和全面;第三,可获取和可利用;第四,可比较和互操作性;第五,致力于改善治理和公民参与;第六,致力于包容性发展和创新。
我国对于公共数据开放的政策要求也与国际标准有许多共性。2017年5月,国务院办公厅印发的《政务信息系统整合共享实施方案》指出,要向社会开放“政府部门和公共企事业单位的原始性、可机器读取、可供社会化再利用的数据集”。
2018年1月,中央网信办、发展改革委以及工业和信息化部联合印发的《公共信息资源开放试点工作方案》要求试点地区“提升数据的完整性、准确性、有效性、时效性”,“明确开放数据的完整性、机器可读性、格式通用性等要求。”
根据2019年10月1日起施行的《上海市公共数据开放暂行办法》,公共数据开放是指公共管理和服务机构在公共数据范围内,面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务。
一方面,各级政府部门掌握了大量基础性、关键性的数据资源,另一方面,各类市场和社会主体也采集和存储了大量具有公共属性和公共价值的数据。这些数据是社会的公共资源,在保障国家秘密、商业秘密和个人隐私的前提下,将这些数据最大限度地开放出来,供社会进行开发利用,有利于培育数据要素市场,释放公共数据的社会经济价值,加快数字化发展,建设数字中国。
2019年以来,各地已出台过一些专门针对数据开放的管理办法,例如:
两者之间既有联系,也有区别。数据开放是信息公开在大数据时代的递进和深入发展。在开放的对象上,数据开放的对象是数据,而不是信息。“数据”是指一手的原始记录,未经加工与解读,不具有明确意义,而“信息”则经过了分析、加工和解读,被赋予了特定意义。可以说,数据是信息的底层,数据比信息具有更大的再利用空间和挖掘潜力。
在大数据时代,社会公众和企业对政府信息公开的期望和需求发生了变化,与收到纸质的、文本形式的、非结构化的文件相比,公众期望还能获得电子的、可机读的、结构化的数据,以进行再利用。
目前,在数据开放实践中,开放数据通常呈现为以电子化、结构化、可机读格式开放的数据集。数据集是指由数据组成的集合,通常以表格形式出现,每一列代表一个特定变量,每一行则代表一个样本单位。
在开放的目的上,政府信息公开的主要目标是保障公众的知情权,提高政府透明度,侧重于其政治和行政意义。政府数据开放则是不仅要让社会知情,还要让社会能利用政府数据,从而释放政府数据的能量,创造社经济会价值。可以说,政府数据开放的根本目的不在于开放本身,而在于让社会对政府数据进行充分利用并创造价值。
包括各职能部门以及履行公共管理和服务职能的事业单位在依法履职过程中产生和采集的数据资源政府各职能部门以及履行公共管理和服务职能的事业单位在依法履职过程中产生和采集的数据资源。
不仅包括政府数据,还包括各类市场和社会主体经政府部门授权在履行公共管理和服务职能的过程中产生和采集的数据资源,或市场和社会主体虽未经过政府部门授权但在合法经营活动中产生和采集的具有公共属性、涉及公共利益的数据资源。
根据《国际开放数据宪章》的定义,广义上的政府数据则不仅包括国家、区域和地方政府、国际政府组织以及广义的公共部门所掌握的数据,还包括外部机构为政府所创建的数据,以及掌握在外部机构手中但与政府项目和服务相关、并具有重大公共利益的数据。
广义的政府数据基本等同于“公共数据”的概念,不仅包括政府数据,还包括政府部门以外的公共事业部门的信息和数据。此外,国有和私有企业受政府委托、得到公共财政支持所创建的数据,以及掌握在这些企业手中但与政府相关、具有重大公共利益的数据也属于公共数据。
可以说,政府数据并非公共数据的全部,而是公共数据的一个子集。公共数据开放也并不等同于政府数据开放。公共数据开放的主体更多元、客体更多样,互动关系也更为复杂。
一般而言,“数据共享”是指在政府体系内部推进数据的跨部门、跨层级、跨地区汇聚融合;而“数据开放”则是政府向社会开放数据集的一种公共服务。
公共数据开放也不等同于社会数据交易。公共数据开放针对的是具有公共产品属性的数据。这些公共数据属于公共资源,在保障国家安全、个人隐私和商业机密的前提下,原则上应最大程度地向社会开放,供其利用和开发。向社会开放公共数据本质上是政府提供的一种公共服务。
而社会数据交易针对的是具有私有商品属性的数据。这类数据由私有企业或个人所生成或采集,其产权归这些企业或个人所有,具有一定的商业价值。数据的所有者有权对这类数据进行交易或交换,并获得合理回报,而不必无偿向社会开放,但政府可以鼓励其在保护国家安全和个人隐私的前提下,出于增进公共利益的目的自愿向社会开放。
原文始发于微信公众号(复旦DMG):公共数据开放被写入十四五规划,“开放数林”为你解读