数据资产入表「第四讲」-数据资源梳理

        数据资源梳理是指对企业或组织中所拥有或使用的各类数据进行详尽的盘点的过程,这个过程的目的是为了更好地理解数据的构成、来源、质量和用途,从而提高数据的可用性和价值。

1.数据库环境梳理

       梳理组织中的数据库地址、存储作用、存储的数据类型。在一些企业或组织中,由于历史原因或者业务需求的多样性导致数据的存储在多个位置或不同的数据库,需要对数据库进行盘点,说明数据库jdbc地址、存储数据类型、存储数据项、支撑的业务线、支撑时间

2.数据资源标准评估

       摸排数据资源中数仓分层标准、主数据说明,主题库/专题库/主题域说明、数据库建模说明、字段的词根库、数据分级分类标准、数据质量标准说明、数据治理规则分类说明等。针对企业中的数据资源建设标准进行评估,从数据建设标准上摸排,评估企业的数据管理成熟度。

3.元数据梳理

       梳理组织中的数仓分层、数据项、数据表、数据字段、业务定义、数据归集方式、数据来源、更新频率、最新更新时间、当前数据量、业务负责人、数据安全级别。在完成第一步梳理后,接下来需要针对数据表单的业务维度进行评估,这一步是形成数据资源目录清单最重要的一个步骤,也是完成数据盘点的基础。在以上提到的维度外,还可以根据企业自身维度,新增企业特有的盘点维度。

4.数据质量评估

       按照当前的数据资产,对数据质量按照国家标准(或组织内部有相关的质量管理标准)进行初步评估。评估维度包含及时性、完整性、有效性、准确性(在资产评估盘点时,这个维度的评估比较困难,需要结合业务含义评估,且质量管理颗粒度的粗细会影响该指标的评分)、一致性、可访问性、对规范的执行深度等维度进行评分,最后获得数据项的评估总分。

5.数据安全合规性评估

       数据安全合规性评估是指针对数据来源和输出的安全合规与否。此项评估需结合公司的法务部门一并执行这项业务,从目前国家颁布的《中华人民共和国个人信息保护法》、《中华人民共和国数据安全法》、《中华人民共和国网络安全法》等一系列的法律政策出台,对于数据合规性的要求也越来越明确。在数据安全合规性盘点过程中,需按照现有数据项和数据使用场景结合数据法条评估数据合规性。

6.数据可用性评估

       以上动作完成后,最后评估数据资产的可用性,该项评估需要结合企业的战略目标,企业是需要开发对应的数据产品或者是要做资产转化,对数据资产的要求会有所不同。

       在数据产品开发过程中,对数据场景开发的数据满足程度和对于场景事实的描述真实程度-即在相对口径下数据的准确性,还有数据供给的及时性都有更高的要求。

       而在数据入表的过程中,则是依赖综合的数据质量评估报告、资产评估机构出具的资产评估报告以及数据来源的合规性评估。

       上述两种情况在业界暂时尚未出具行业标准或者国家标准,所以数据可用性评估目前是以企业或机构内部部门-例如数据中心出具给各个业务部门出具的报告,以便业务部门使用数据,在实际的资产入表过程中是数据管理成熟度的体现和评估的资料说明。

  • 30
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值