一、WordCount分析
接下来看这个图再重新梳理一下单词计数的执行流程
![在这里插入图片描述](https://img-blog.csdnimg.cn/609c20ba68624405981436ab2b1c1371.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5aSn6Ieq54S255qE5Yac5rCR5bel,size_20,color_FFFFFF,t_70,g_se,x_16)
上面的是单个文件的执行流程,有一些现象看起来还是不明显
下面我们来看一个两个文件的执行流程
![在这里插入图片描述](https://img-blog.csdnimg.cn/a0d07edd0a224091a9908574b8ca9cd5.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5aSn6Ieq54S255qE5Yac5rCR5bel,size_20,color_FFFFFF,t_70,g_se,x_16)
二、实战:WordCount案例开发
前面我们通过理论层面详细分析了单词计数的执行流程,下面我们就来实际上手操作一下。
大致流程如下:
第一步:开发Map阶段代码
第二步:开发Reduce阶段代码
第三步:组装Job
在idea中创建WordCountJob类
添加注释,梳理一下需求:
需求:读取hdfs上的hello.txt文件,计算文件中每个单词出现的总次数
hello.txt文件内容如下: