随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的需求。
为此,7月11日,培训中心“云环境下大数据挖掘和分析技术实战”公开课在北京举行。
本课程从大数据挖掘分析技术实战的角度,结合理论和实践,全方位地介绍基于Yarn的Mahout和基于Spark的MLlib等大数据挖掘工具的开发技巧。
涉及的主题包括:
大数据挖掘及其背景;
Mahout和 MLlib大数据挖掘工具;
推荐系统及电影推荐案例,分类技术及聚类分析;
与流挖掘和Docker技术的结合,分析了大数据挖掘前景。
培训过程中,杨老师还提供了案例分析来帮助学员了解如何用Mahout和 MLlib挖掘工具来解决具体的问题,并介绍了从大数据中挖掘出有价值的信息的关键。
杨老师对于大数据挖掘有深入的理论研究与实践经验,讲课过程中,将会针对这些问题与学员一起进行探讨,在关键点上搭建实验环境进行实践研究,以加深对于这些解决方案的理解。
通过本课程学习,希望推动大数据分析挖掘项目开发上升到一个新水平。