概述
数据治理是一个对数据进行管控的过程,是对数据生命周期管理,包括数据标准、元数据、数据模型、数据分布、数据存储、数据交换、数据质量、数据安全以及数据共享服务等。数据治理的目标是打造一个全生命周期的数据管理过程,从数据产生、到应用数据之间应用形成一个数据管理的闭环,形成数据资产,为信息化提供高质量、准确的数据生产资料,将生产资料转变为数据生产力。
数据生命周期管理
挑战
自然资源数据主要以空间数据为主,既有来源于内部的基础地理、遥感影像、土地、地址、矿产、海洋、林草、湿地等数据,也有来源于外部其它部分的社会经济、人口数据,还有来源于互联网的各类数据。既要实现内部数据的汇交、备案、交换与同步;也要实现和外部数据的共享和融合。构建自然资源“一张图”,形成统一标准规范的数据资产,关键是要形成数据质量治理、数据应用和共享体系,对数据在不同阶段的过程进行管理。
大数据背景下,数据来源越来越广泛,越来越多的数据需要融合。同时数据的获取渠道和方法、数据组织存储方式在变化,不同格式、不同标准的数据需要融合,共享、交换。这些变化以及对数据如何使用是一个不断发展和变化的过程,需要打造一个有生命力、能自扩展的数据集成管理平台,适应数据的发展和变化,在不同的数据管理和应用阶段提供动态的数据管控能力,满足对不用数据的管理和应用的需求。
空间数据集成管理平台
自然资源数据具有来源广、标准异质各异,且相当大一部分数据动态性较高等特征,不论是数据库的初始构建还是其后续持续更新和使用,都需要强大而灵活的空间数据整合与集成技术支撑。
空间数据集成管理平台最重要的能力是提供一个可视化、零开发的环境,是用户根据数据的变化和规程的变化,有效的构建出提要数据处理的模型和方案,在空间数据集成管理平台之上进行统一的运行和管理,提供一种动态的、用户可自扩展的数据治理体系,解决传统数据管理系统不能应对数据变化不断重复建设带来的困扰。