大数据分析挖掘培训课程要点-基于Hadoop/Mahout/Mllib的大数据挖掘
目前对大数据的分析工具,首选的是Hadoop/Yarn平台。Hadoop/Yarn在可伸缩性、健壮性、计算性能和成本上具有无可替代的优势,事实上已成为当前互联网企业主流的大数据分析平台。
一、培训对象
1,系统架构师、系统分析师、高级程序员、资深开发人员。
2,牵涉到大数据处理的数据中心运行、规划、设计负责人。
3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。
4,高校、科研院所牵涉到大数据与分布式数据处理的项目负责人。
二、学员基础
1,对IT系统设计有一定的理论与实践经验。
2,数据仓库与数据挖掘处理有一定的基础知识。
3,对Hadoop/Yarn/Spark大数据技术有一定的了解。
三、培训要点
本课程从大数据挖掘分析技术实战的角度,结合理论和实践,全方位地介绍Mahout和 MLlib等大数据挖掘工具的开发技巧。本课程涉及的主题包括:大数据挖掘及其背景,Mahout和 MLlib大数据挖掘工具,推荐系统及电影推荐案例,分类技术及聚类分析,以及与流挖掘和Docker技术的结合,分析了大数据挖掘前景分析。
本课程教学过程
目前对大数据的分析工具,首选的是Hadoop/Yarn平台。Hadoop/Yarn在可伸缩性、健壮性、计算性能和成本上具有无可替代的优势,事实上已成为当前互联网企业主流的大数据分析平台。
一、培训对象
1,系统架构师、系统分析师、高级程序员、资深开发人员。
2,牵涉到大数据处理的数据中心运行、规划、设计负责人。
3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。
4,高校、科研院所牵涉到大数据与分布式数据处理的项目负责人。
二、学员基础
1,对IT系统设计有一定的理论与实践经验。
2,数据仓库与数据挖掘处理有一定的基础知识。
3,对Hadoop/Yarn/Spark大数据技术有一定的了解。
三、培训要点
本课程从大数据挖掘分析技术实战的角度,结合理论和实践,全方位地介绍Mahout和 MLlib等大数据挖掘工具的开发技巧。本课程涉及的主题包括:大数据挖掘及其背景,Mahout和 MLlib大数据挖掘工具,推荐系统及电影推荐案例,分类技术及聚类分析,以及与流挖掘和Docker技术的结合,分析了大数据挖掘前景分析。
本课程教学过程