《大数据之路:阿里巴巴大数据实践》系列丛书
第1章 总述
第1篇 数据技术篇
第2章 日志釆集
第3章 数据同步
第4章 离线数据开发
第5章 实时技术
第6章 数据服务
第7章 数据挖掘
第2篇 数据模型篇
第8章 大数据领域建模综述
第9章 阿里巴巴数据整合及管理体系
第10章 维度设计
第11章 事实表设计
第3篇数据管理篇
第12章 元数据
第13章 计算管理
本文介绍了阿里巴巴大数据实践中数据质量保障的重要性,包括完整性、准确性、一致性和及时性四个原则。通过数据资产等级、加工环节卡点校验、风险点监控和质量衡量等方法确保数据质量。数据资产等级的定义和应用,以及在线和离线系统的数据质量控制策略,如BCP在线监控和DQC离线监控,是保障数据质量的关键。此外,文中提到了数据质量衡量指标,如起夜率、数据质量事件和故障体系,以评估和改进数据质量建设。
第1章 总述
第1篇 数据技术篇
第2章 日志釆集
第3章 数据同步
第4章 离线数据开发
第5章 实时技术
第6章 数据服务
第7章 数据挖掘
第2篇 数据模型篇
第8章 大数据领域建模综述
第9章 阿里巴巴数据整合及管理体系
第10章 维度设计
第11章 事实表设计
第3篇数据管理篇
第12章 元数据
第13章 计算管理
265

被折叠的 条评论
为什么被折叠?