![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hadoop
新世界的海贼
这个作者很懒,什么都没留下…
展开
-
Hadoop 多个job
书上说的不清晰透彻,下面是在StackOverflow上的一个方案,我觉得很好:(1) Cascading jobsCreate the JobConf object "job1" for the first job and set all the parameters with "input" as inputdirectory and "temp" as output directory. E转载 2014-10-10 11:33:30 · 1253 阅读 · 0 评论 -
编译mahout使其支持hadoop2.6
Mahout0.9的版本只支持hadoop1.x版本,现在hadoop2.x比1.x更灵活、功能更强大、应用更广,支持2.x那是必然的。在mahout的主干代码上已经是支持hadoop2.2的了,下面就编译源代码用于支持hadoop2.6,因为自己搭建的环境是这个版本。 1、从github上clone一份源代码 2、修改pom.xml文件 找到hadoop.version一项原创 2015-03-19 17:32:48 · 4559 阅读 · 0 评论 -
本地eclipse连接远程hadoop集群运行wordcount实例,实现远程调试
条件:1.远程hadoop集群能正常运行 2.将hadoop-eclipse-plugin-x.x.x.jar加入到eclipse的plugins中 3.在eclipse中配置好mapreduce location,确保eclipse能脸上hdfs 4.在创建的mapreduce工程中加入hadoop的所有配置文件,即etc/had原创 2015-03-12 16:18:21 · 837 阅读 · 0 评论