hadoop 1.2.1安装配置

尝试进入大数据领域开发,从目前最火的Hadoop入手是必须的,本文一步步记录了 Ubuntu 环境安装Hadoop 1.2.1 ,搭建单机模式以及伪分布式模式,希望对各位和我一样的菜鸟有所帮助,共同学习进步,欢迎交流。尝试2.1安装失败,由于文件结构不太一样缺乏相关资料,也非做运维的,遂放弃改用成熟的hadoop 1.2.1版本。

----------------------------------------单机模式-----------------------------------------

下载:hadoop-1.2.1.tar.gz

解压:

[plain]  view plain copy
  1. tar -xzvf hadoop-1.2.1.tar.gz   
转移:

[plain]  view plain copy
  1. mv hadoop-1.2.1/ /opt  
进入conf文件配置环境变量


让环境变量配置生效source,是source,不是sh,补充下sh和.的区别,参考

[plain]  view plain copy
  1. source hadoop-env.sh   

检测是否安装成功

[html]  view plain copy
  1.   

单机版hadoop安装成功,测试一下

[html]  view plain copy
  1. mkdir input  
[html]  view plain copy
  1. cp -R conf input/  

运行wordcount程序并将结果保存到output

hadoop hadoop-examples-1.2.1.jar 

错误: 找不到或无法加载主类 hadoop-examples-1.2.1.jar

hadoop  jar  hadoop-examples-1.2.1.jar wordcount input output   发现错误,粗心害死猫....修改后运行,OK!


单机模式成功, 接下来搭建伪分布式

-------------------------------------------华丽的分割线 伪分布式-----------------------------------------

hadoop目录下创建以下目录:

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1$ mkdir tmp  
  2. dat@dat-HP:/opt/hadoop-1.2.1$ mkdir hdfs  
  3. dat@dat-HP:/opt/hadoop-1.2.1$ mkdir hdfs/name  
  4. dat@dat-HP:/opt/hadoop-1.2.1$ mkdir hafs/data  

编辑core-site.xml

[plain]  view plain copy
  1. <configuration>  
  2.    <property>  
  3.         <name>fs.default.name</name>  
  4.         <value>hdfs://localhost:9000</value>  
  5.     </property>  
  6.     <property>  
  7.         <name>hadoop.tmp.dir</name>  
  8.         <value>/opt/hadoop-1.2.1/tmp</value>  
  9.     </property>  
  10. </configuration>  

hdfs-site.xml:

[plain]  view plain copy
  1. <configuration>  
  2.   <property>  
  3.         <name>dfs.replication</name>  
  4.         <value>1</value>  
  5.     </property>  
  6.     <property>  
  7.         <name>dfs.name.dir</name>  
  8.         <value>/opt/hadoop-1.2.1/hdfs/name</value>  
  9.     </property>  
  10.     <property>  
  11.         <name>dfs.data.dir</name>  
  12.         <value>/opt/hadoop-1.2.1/hdfs/data</value>  
  13.     </property>  
  14. </configuration>  

mapred-site.xml:

[plain]  view plain copy
  1. <configuration>  
  2.   <property>  
  3.         <name>mapred.job.tracker</name>  
  4.         <value>localhost:9001</value>  
  5.     </property>  
  6. </configuration>  

格式化HDFS(建议只格式化一次,多次格式化据传后边会引起问题,本人没有尝试...):

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1/conf$ source hadoop-env.sh   
  2. dat@dat-HP:/opt/hadoop-1.2.1/conf$ hadoop namenode -format  


启动Hadoop:

执行执行bin/start-all.sh来启动所有服务,包括namenode,datanode,start-all.sh脚本用来装载守护进程

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1/bin$ start-all.sh   


用java的jps命令验证是否安装成功:

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1$ jps  


少一个DataNode进程没有启动,通过查看上边现实的路径下的日志发现:


很明显,data文件夹的权限不对,修改权限:

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1/hdfs$ chmod 755 data  

关闭hadoop,重新启动:

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1/bin$ stop-all.sh  
[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1/bin$ start-all.sh   
[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1/bin$ jps  


6个进程全部启动了,此时安装正常,可以进行Hadoop的相关操作了。


检查运行状态:可以通过下面的操作来查看服务是否正常,在Hadoop中用于监控集群健康状态的Web界面

http://localhost:50030/     - Hadoop 管理介面
http://localhost:50060/     - Hadoop Task Tracker 状态
http://localhost:50070/     - Hadoop DFS 状态


hadoop的伪分布模式已经安装成功,再次在伪分布模式下运行一下WordCount来感受MapReduce过程:

这时注意程序是在文件系统dfs运行的,创建的文件也都基于文件系统:


首先在dfs中创建input目录

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1/conf$ hadoop dfs -mkdir input  
  2. Warning: $HADOOP_HOME is deprecated.  

将conf中的文件拷贝到dfs中的input

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1$ hadoop dfs -copyFromLocal conf/* input  

在伪分布式模式下运行WordCount

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1$ hadoop jar hadoop-examples-1.2.1.jar wordcount input output  


INFO mapred.JobClient:  map 100% reduce 0% 到这里卡死不动了。

解决办法:查询鸟文论坛帖子(http://stackoverflow.com/questions/10165549/hadoop-wordcount-example-stuck-at-map-100-reduce-0)发现,修改/etc/hosts文件,加入主机名和IP地址的映射。

检查主机名:

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1/conf$ hostname  


修改/etc/hosts文件:


重新来过:

[plain]  view plain copy
  1. hadoop dfs -rmr output/  
  2. hadoop jar hadoop-examples-1.2.1.jar wordcount input output  
依旧不起作用...........重启,再重新来过.................ok!!!

oK!!看见没有,你成功了!!!!!!

检测一下输出信息:

[plain]  view plain copy
  1. dat@dat-HP:/opt/hadoop-1.2.1$ hadoop dfs -cat output/*  
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值