我国政府数据开放共享标准体系构建

发布时间:2020-09-16 来源: 工作总结 点击:

 构建政府数据开放共享标准体系的必要性 2020 年 4 月 9 日,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》(以下简称为《意见》),将“推进政府数据开放共享”列为加快培育数据要素市场的三大要点之首。

 政府数据作为国家基础性战略资源,在数据要素市场化配置中起经济治理的作用,对《意见》提及的“提高要素配置效率”“促进...数据资源有效流动”至关重要。而这一作用的发挥依赖于政府数据开放共享,并且需要在政府数据社会化利用的过程中实现增值,拓展至“丰富数据产品”“引导培育大数据交易市场”“培育数字经济新产业”等价值空间。正如美国政府数据开放平台(data.gov)上的声明所言,“政府数据开放共享赋能应用程序的开发”;国家发改委提出“加快全国一体化大数据中心建设”,也只有实现数据的流通与共享,才能激发这种新型基础设施的经济动能。然而政府数据从创建伊始、采集、组织直至开放共享等全生命周期过程,均离不开统一的标准规范作为数据质量和利用水平的保障。

 构建政府数据开放共享标准体系是我国国家战略的需要。《促进大数据发展行动纲要》(以下简称为《纲要》)指出“提升政府数据开放共享标准化程度”“制定实施政府数据开放共享标准”“建立标准规范体系”;《2018 年政务公开工作要点的通知》强调“依托政府网站集中统一开放政府数据,探索制定相关标准规范”。《意见》提出“建立统一规范的数据管理制度”“制定数据隐私保护制度和安全审查制度”“推动完善...数据分类分级安全保护制度”,可见标准体系的建设,对营造安全有序的数据要素市场环境十分必要。

 构建政府数据开放共享标准体系是破解当前现实难题的途径。我国缺乏统筹兼用的政府数据开放共享标准体系,仅有广东、山东、上海出台了关于数据开放的地方标准和指南共 6 项,国家标准仅有全国信标委大数据标准工作组研制的 3 项,并且还尚待发布。然而这种现状之下,政府数据开放共享的标准化建设依然远未引起重视,只有上海、北京、福州等 9 个城市在其发布的数据开放政策文件中略有提及,如上海市政府发布的《上海市公共数据开放暂行办法》第三十二条“标准体系和技术规范”提到,鼓励不同主体参与制定数据开放标准。正是由于我国政府数据开放共享标准规范的缺失,造成当前 102 个地方政府数据开放平台系统各异、“烟囱”林立,各平台共开放的 71092 个数据集异构分散、难以整合,甚至给我国部分政府部门带来了开放共享后数据价值的流失、数据流通存在安全隐患等隐忧,这既不利于用户的利用,也很难使政府数据成为市场有效流动、交换共享的要素。

 因此,亟待构建我国政府数据开放共享标准体系,促进政府数据的综合利用。

 我国政府数据开放共享标准体系的构建 为了使我国政府数据开放共享工作有据可依、规范实施,笔者以数据生命周期理论为指导,主要参考了多个开放数据全生命周期模型,如“开放政府数据生命周期”“关联开放政府数据与元数据生命周期”,由此构建了贯穿我国政府数据开放共享全流程的政府数据开放共享标准体系框架(见图 1)。

 依据规范化流程的界定,该体系划分成 6 个标准子体系,按照各阶段不同环节涉及的领域、范围、功能和活动,细化形成 23 项标准,并对其覆盖范围、关键内容进行总结,选择重点领域标准进行研制。

  (一)数据创建与汇交标准

  数据开放原则规定我国政府数据开放共享的最低限度、行动准则和目标指向,具体内容源于国家政策。数据格式标准指明不同领域数据、混合数据应采用的格式类型。数据采集标准从采集原则和方式入手,是获取高质量数据的保证。数据提交标准涉及技术规范,包括提交流程、可用接口及元数据要求;也涉及操作规范,包括提交者的认证方式和数据上传频率。

  (二)数据选择与处理标准

  数据审选标准在内容上涵盖与数据集相关的法律、安全、技术及元数据的信息,流程上建议遵循“数据集映射、优先级排序、实施选择、主题分类、数据目录发布”的次序。数据安全风险评估标准是针对数据中个人隐私、商业机密、国家安全等敏感信息进行安全影响评估的指标和流程。数据脱敏标准包括处理敏感信息的原则、流程、方法和工具。

  (三)数据描述与组织标准

 元数据标准用于揭示政府数据的外部特征和内容特征,笔者此前已撰文设计我国开放政府数据元数据元素集方案,并在该版本基础上增设了“共享(Sharing)”元素。数据分级标准的重点是确定分级方法,并限定各等级的数据的开放共享程度。数据目录分类标准是从资源属性、基础信息、主题信息、属地类别、业务属性和授权类别等多个角度建立的类目体系。

  (四)数据关联与发布标准

  数据开放优先级标准要指明重点开放《纲要》明确提到的 20 个领域,优先开放利于促进公共服务效益、提高政府透明度的数据集。数据关联标准要遵循 W3C 政府关联数据工作组建议的关联数据发布实践、以及《开放数据五星部署方案》中的相关要求,对关联流程、技术原则和衡量关联程度的指标进行统一规范。数据发布标准规定的是有待开放的数据上传至数据开放平台的流程和方式。

  (五)数据发现与利用标准

  开放许可协议采用兼容性强、应用广泛的《知识共享许可协议》。数据开放平台标准提出建立国家和地方层面政府数据开放门户的底层技术架构、统一数据检索协议,同时明确运营管理规则,以确保各平台的功能一致性、运行稳定性。数据互操作标准侧重于规范数据互操作框架和互操作级别,前者用于统一互操作的原则和条件,后者考虑法律、机构、语义和技术等方面的互操作问题。数据利用反馈标准涉及用户的反馈渠道、方式及主管部门分析反馈结果的方法。

  (六)数据管理与评估标准

  数据保存标准通过规定数据存储的介质、方式、保存格式和编码方式实现政府数据长期保存。数据更新标准参照地方标准的更新规则和模式进行建立。数据管理标准说明数据管理的主体及其职责、流程与制度,以及针对人口、法人等政府主数据的统筹管理。数据维护标准遵循“定期维护数据和元数据、检查URI、根据用户反馈进行改进”的流程。数据质量评价标准用于评价数据内容质量,涉及具体的指标和流程。政府数据开放共享评估标准包括规范的评价策略、指标和方法。

  我国政府数据开放共享标准体系构建的考虑

 (一)广泛吸纳国内外实践成果

  该体系在设计之初,除借鉴国外的数据生命周期模型,关注国际动态以外,还通过参考我国大数据标准体系的构建思路,注重与大数据标准化工作的协调,其所划分的标准类型均能在该体系中体现,如具有基础特性的数据开放原则、数据方面的元数据标准、技术方面的数据互操作标准、平台方面的数据开放平台标准、管理方面的数据维护标准、安全和隐私方面的数据安全风险评估标准等。

  在确定标准的关键内容时,还重视采纳国内外标准、较为成熟的协议和指南的核心内容,如数据格式标准选用爱尔兰《开放数据技术框架》的“开放数据推荐格式”;数据安全风险评估标准的制定根据国际标准《信息技术安全技术隐私影响评估指南》(ISO/IEC29134:2017)的要求;数据脱敏标准规定的原则、流程和方法采用了山东省地方标准《公共数据开放第 2 部分:数据脱敏指南》(DB37/T3523.2-2019)。

  (二)立足当前需求与未来发展

  该体系围绕我国建立国家政府数据统一开放平台、识别重点和优先开放领域、分级分类开放共享等需求,分别制定了数据开放平台标准、数据发布标准、数据分级标准,旨在贴合国家政府数据开放共享建设的实际要求。同时,该体系还考虑到政府数据开放共享的热点和前沿问题,以期适应未来发展的需要,如数据关联标准着眼于解决关联开放政府数据的发布问题;数据管理标准可为开放共享环境下政府主数据管理的实践提供具体的参考。

  (三)面向多个主体的规范应用

 该体系所涵盖的多数标准有助于为数据提供方有序开展政府数据的创建、采集、加工、发布等活动提供参考。数据平台标准能对数据平台方解决搭建、管理和运营政府数据开放平台的问题提供具有可操作性的策略。数据利用反馈标准用于帮助数据利用方以规范的行为获取数据、提交反馈信息和对数据进行再利用。政府数据开放共享评估标准有利于引导评估机构开展评测工作。

 该体系力求架构完整,界限分明,以及各项标准之间的有序衔接。希望政府部门、标准化机构、高校、企业给予关注,推动该体系在我国试点地区进行验证、实施和应用,加速政府数据开放共享整体进程,从而扩大要素市场化配置范围,健全要素市场体系,激发全社会创造力和市场活力。

 当然,该体系需要在实际应用过程中及时调整和持续完善。正如国家标准《标准体系构建原则和要求》(GB/T13016-2018)的规定,“标准体系是一个动态的系统,在使用过程中应不断优化完善,并随着业务需求、技术发展的不断变化进行维护更新”。

相关热词搜索:构建 体系 开放

版权所有 蒲公英文摘 www.zhaoqt.net