一、项目方案
1.1 项目背景
数据治理二期的背景:针对新接入的18个业务系统,借助全农码大数据平台所具备的对海量数据的“存、算、分析、赋码”等一体化能力,完成10个以上业务库的数据治理、数据关联互通,数据资产体系建设与数据共享等等方面的建设。
1.2 项目目标
具体如下:
(1)对资源类、主体类、产品类数据进行异常值处理、数据关联和清洗校核等治理工作.
(2)采用人工校验检查和利用数据清洗模型、算法工具等对数据进行集成,校准异常值、补齐缺失值,形成规范统一的数据资源。
(3)梳理出数据中的关键要素对象,开展数据建模、进行统一、标准化赋码,并实现各赋码要素数据之间的关联互通。
(4)对治理的数据进行相关指标统计和工作报告等撰写。
(5)建设数据资源目录识别工具,方便后续业务人员开展数据资源分类和目录挂接工作。