一、单词计数
首先看来一个快速入门案例,单词计数
这个需求就是类似于我们在学习MapReduce的时候写的案例
需求这样的:读取文件中的所有内容,计算每个单词出现的次数
这个需求就没什么好分析的了,咱们之前在学习MapReduce的已经分析过了,接下来就来看一下使用Spark需要如何实现。
注意:由于Spark支持Java、Scala这些语言,目前在企业中大部分公司都是使用Scala语言进行开发,个别公司会使用java进行开发,为了加深大家对Spark的理解,也满足java老程序员的需求,针对本课程中的案例,我们都会先基于Scala代码进行详细的讲解,然后再使用java代码重新实现一遍。
二、创建maven项目
下面来创建一个maven项目,集成java和scala的sdk