首先运行老师给个另一个相似的代码
数据源如下:
ps:这里发现老师给的数据源是错的,2019年的数据没格式化好
就是因为这个bug,我一直运行不出来,一直报错。。。
这边的数据如果是.txt文件的形式的话是长这样:
1925-11-23 15:23:33 23c 时间YYYY-MM-dd空格HH:mm:ss制表符温度
现在要求每年温度最高的前三天的温度和日期
具体参考资料:
hadoop2.5.2学习09–MR之统计每月最高三个温度
18-hadoop-weather案例
仿照老师的写就可以了
注意:要实现只输出前三的结果,WeatherGroup也是是要写的
所有的代码我放在weather3里面了
现在还存在一个问题
就是我现在hadoop要手动配置dchp,然后网络连接设置为桥接才可以
但是这样就上不了网了,每次要上网,都需要将其设置为自动和nat连接才行