韩亚飞_yue31313_韩梦飞沙 QQ:313134555
目录
数据治理概念:
对业务的数据管理和利用,为用户创造价值。
Data Governance
数据治理架构:
大数据架构:
大数据基础设施硬件 基于普通商用服务器的集群。
也可以与云计算平台结合,运用其中的虚拟化和弹性资源调度,为大数据提供可伸缩的计算资源和基础设施。
大数据一体机:
通过预装软件。
硬件根据软件做定制。
基础设施包括3个:网络、存储、计算。
资源管理 方法
1、虚拟化
2、基于yarn或mesos的资源管理
元数据管理 :
包含元数据 创建、存储、整合、控制功能。
元数据管理在大数据治理有非常重要的地位。能够提升战略价值,帮助决策。
在数据仓库中 元数据需要的内容:
1、描述哪些数据在数据仓库中
2、定义要进入数据仓库中的数据 和 从数据仓库产生的数据
3、记录数据抽取时间。
4、记录和检测 数据是否一致
5、衡量数据质量
主数据:
用户的各个系统要共享的数据。
主数据管理,就是为了保证主数据的一致... 保证主数据正确的单一视图。
主数据管理构建于ETL技术之上。
元数据标准:
通过描述数据的标准化,便于数据的理解和共享。
目前标准有 行业标准、国际标准。
国际标准 参见 ISO IEC11179。
大数据架构:
大数据技术架构 :
</