果然网上总是有大佬手把手教我们走向人生巅峰
http://blog.csdn.net/csj941227/article/details/71786040
出现的问题
1.spring for hadoop 是为hadoop开发弄的框架,跟spring for web 和hadoop集成没关系
2.Hadoop各种相关jar包里的FSDataInputStream中的readline方法过时了,解决办法,套上InputStreamReader和BufferedReader,用BufferedReader的readline
http://www.360doc.com/content/11/0928/12/7809531_151850920.shtml
3.Job的setJarByClass方法,作用是找到该类所在的jar包,所以当我发现我的程序一直完好无损地用着WordCount.class,我也“吓尿了”,因为我的WordCount类和我的类在一个工程里
http://www.cnblogs.com/ggbond1988/p/4797014.html
明天把两个spring boot俩工程打个包放到集群上跑一下,看好不好使,直接调接口看有没有数据就行,因为reducer现在返回的数据还是无序的,要注意一下。
如果没问题,解决了reducer排序问题,开始下一个算法。