- 计算1949-1955年,每年温度最高的时间
- 思路分析
①Mapper,按照年份升序排序,同时每年的温度降序
②Reduce,按照年份分组, 每年对应一个reduce任务
- Hadoop中如何自定义排序,自定义分区,自定义分组。
- --需求:
- 1.计算在1949-1955年,每年温度最高的时间
- 2.计算在1949-1955年,每年温度最高前十天
- --思路:
- 1.按照年份升序,同时每一年中温度降序排序
- 2.按照年份分组,每一年对应一个reduce任务
- mapper输出,key为封装对象。
- --目的:
- 自定义排序
- 自定义分区