元数据

1.元数据的定义:

元数据是关于数据的数据,元数据打通了源数据、数据仓库、数据应用、记录了数据从产生到消费的全过程。元数据主要记录数据仓库中魔性的定义、各层级间的映射关系、监控数据仓库的数据状态及ETL的任务运行状态。在数据仓库系统中,元数据可以帮助数据仓库管理员和开发人员非常方便地找到他们所关心的数据,用于指导其进行数据管理和开发工作,提高工作效率。 --《大数据之路》

元数据又分为技术元数据和业务元数据两大类:

  • 技术元数据:Hive的表结构信息分区信息等,MapReduce任务执行信息,oozie,宙斯,阿兹卡班任务的运行信息,依赖信息
  • 业务元数据:数据报表的口径定义,指标清洗规则等,用来解释某些业务流程或者指标的由来

2.元数据价值

元数据最重要的应用价值是数据管理、数据内容、数据应用的基础,在数据管理方面为集团数据提供在计算、存储、成本、质量、安全、模型等治理领域上的数据支持。 --《大数据之路》

元数据对应用链路分析和数据建模还有驱动ETL开发方向非常重要。
公众号

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值