1. 执行流程 wordCount
2. partitioner与combiner的区别
partitioner是分组,将要清洗的数据按照key来对其进行分组,相同的key放在同一个输出文件中
combiner是在进入reduce之前,先进行一次合并,提高计算效率
3. mapreduce有分区流程
1) 创建项目
2) 导入jar包
3) 创包、创类
4) 书写代码
① 创建Mapper类
② 创建reduce类
③ 创建分区类
④ 创建提交类
1. 执行流程 wordCount
2. partitioner与combiner的区别
partitioner是分组,将要清洗的数据按照key来对其进行分组,相同的key放在同一个输出文件中
combiner是在进入reduce之前,先进行一次合并,提高计算效率
3. mapreduce有分区流程
1) 创建项目
2) 导入jar包
3) 创包、创类
4) 书写代码
① 创建Mapper类
② 创建reduce类
③ 创建分区类
④ 创建提交类