大数据计算服务(MaxCompute,原名 ODPS)是一种快速、完全托管的 GB/TB/PB 级数据仓库解决方案。MaxCompute 向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。
数据质量问题一直是大数据分析系统关注的重点,如何发现数据质量问题,提升数据质量,一直是各生产及业务系统的追求点。通过此课程,可迅速掌握发现数据质量问题的方法,解决数据质量问题。
详细了解请点击:使用MaxCompute搭建社交好友推荐系统
(通过本案例,学员可了解影响数据质量的因素,出现数据质量问题的类型,掌握通过MaxCompute(DateIDE)设计数据质量监控的方法,最终独立解决常见的数据质量监控需求。)
内容列表
数据质量基本介绍
介绍什么是数据质量,数据质量对于数据分析、应用的重要性。
数据质量影响因素
介绍可能会影响到数据质量的因素,以及这些因素分别会如何影响数据质量。
数据质量问题类型
常见的数据质量问题的类型,以及各自的特点和影响。
阿里云相关产品介绍
介绍本课程中用到的阿里云产品大数据计算服务和大数据开发套件。
阿里云相关产品基本操作演示
演示本课程中用到的阿里云产品大数据计算服务和大数据开发套件。
电商分析平台数据质量核查
介绍项目背景、项目实施流程以及其中的关键步骤和技术。
【在线实验】MaxCompute 数据质量核查
本实验通过MaxCompute对一家销售公司的经营数据进行监控,并最终输出数据质量监控报告。
适合人群
- 大数据开发者
- 大数据分析师
阿里云大学官网(阿里云大学 - 官方网站,云生态下的创新人才工场)