数据资产目录与索引

通过数据资产盘点,企业终于知道他们拥有哪些数据、如何使用数据、是否安全以及数据在哪里。 然而,据笔者观察,业内大多数的数据资产盘点工作是通过手工作业的方式进行的,使用Excel工具进行记录。请不要小瞧这种方式,Excel手工盘点数据资产的方式之所以是主流,证明其简单易用、方便灵活、协作敏捷的特点是被广泛认可的。这里要提醒广大的数据产品经理们注意了:如果你能涉及出一款比Excel还灵活、好用的数据盘点工具,一定会大受欢迎!可能有人要问,数据梳理的再好,盘点的再清晰,那输出的也只不过是一堆Excel,对企业没有什么价值啊?

是的。这个时候就需要“数据资产目录”来发挥他的作用了!。

数据资产目录是什么

我经常将书的目录与数据目录进行类比,翻开一本书的目录,它会告诉你这本书写了啥、内容结构、作者的写作思路等,如果你对某一章节感兴趣,通过目录就可以快速找到这想看的内容。图书目录起到提纲挈领,纲举目张的作用。

数据资产目录也一样,它也有都有“字典”的作用,能够帮助企业相关业务和技术人员快速定位数据,解释数据,找到数据,并从中提取业务价值。

除以上经济行为外,当数据持有人有提高内部管理水平、量化资产价值等需求时,也可对数据资产进行评估。

1、数据资产目录的本质

数据资产目录本质上就是一个元数据的存储库,它提供特定范围内所有数据资产的清单,无论其位置或来源如何。数据目录包括有关数据资产的关键属性信息,例如:名称、业务含义、类型、大小、模式和其他相关属性。

数据资产目录支持数据治理,包括:数据的分类分级,数据权限的管理,识别冗余和不一致的数据并为数据血缘分析和影响分析奠定了基础。

2、数据资产目录与数据目录

数据资产目录和数据目录本质上是一样的,都是元数据管理。

在项目实践中,数据目录也叫数据资源目录,一般是指通过元数据管理工具,对相关数据源(业务系统数据库、数据仓库、数据湖等)的元数据进行采集,而形成的数据目录。由于直接采集过来的基本都是数据库表结构、数据流、ETL脚本、数据库操作日志等技术元数据,所以数据目录要有一定的技术基础才能看懂,而且它的定位就是给技术人员看的。

而数据资产目录是数据目录的子集,更多是站在业务的视角,以利益相关者的数据需求为目标对那些预期能够为企业带来价值的数据进行分类分级,业务元数据定义、打标签,授权等。

数据资产目录特点?

区别于技术人员使用的数据字典,数据资产目录的定位是面向业务的,鼓励业务人员参与建设和使用十分关键,数据资产目录必须是业务人员所熟悉的场景和流程,是客观反映银行目前数据现状的,是可扩展的支持未来取数用数的。

一个使用友好的数据资产目录,能够打通查数/取数环节、打通基础类数据和指标类数据的联系,并通过人工智能和机器学习等先进技术,更好地支持数据的探查和关联推荐。

数据资产目录体系框架

我们在进行数据资产目录构建时,需要结合数据资产类型,定义数据资产的属性,不同资产类型对应不同业务属性,管理属性,应用模式、资产目录视角等,达到千数千面的效果,最终形成数据资产权威、可信、可用的企业级数据资产目录。

以业务领域构建资产目录为例,可以通过资产盘点,梳理银行数据主题分类/核心业务板块,再根据业务要素逐步向下划分二级目录、三级目录,最后到叶子结点的信息项上。信息项的定义也是从业务出发,梳理业务板块都有哪些数据内容,例如客户信息包括:客户名称、联系方式、地址、证件类型、证件号码等。

数据资产分布与映射关系建立

在技术元数据采集的基础上,探索信息项所属系统来源,确认其系统分布情况,将数据资产信息项与物理表/字段间构建映射关系,并确定权威数据来源。对于单个业务系统而言,只需要将主表中经过分析最准的内容映射过来,而不是所有表,避免数据使用者因为多表冗余存储造成混淆。

我们以“客户中文姓名”这一信息项为例,梳理数据来源与系统表映射关系如下:

数据资产目录的应用价值

通过数据资产目录,可以解决数据在哪里、数据谁负责,数据如何用等一系列问题。数据资产目录的准确性,也决定了应用时的效果。

数据在哪里:业务部门能够通过数据目录查询到现有数据资产情况以及索引对应的系统表字段,定位权威系统数据来源。

数据谁负责:在数据质量检核规则发现问题时,根据字段所属的数据资产来确定数据质量问题的牵头整改责任归属。

数据如何用:精准定位数据所在系统/表/字段,提升数据提取需求的准确性和效率;打通系统间形成的数据孤岛,实现编码规则等标准的统一规范、使数据互联互通。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值