搭建Hadoop的环境-第三讲

准备实验的环境:
1、安装Linux、JDK
2、配置主机名、免密码登录   参考博客:http://blog.csdn.net/a639735331/article/details/79229826
3、约定:安装目录:/root/training


安装:
1、解压 : tar -zxvf hadoop-2.4.1.tar.gz -C /root/training/
2、设置环境变量: vi ~/.bash_profile

HADOOP_HOME=/root/training/hadoop-2.4.1
export HADOOP_HOME
PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export PATH
export  HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export  HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_COMMON_LIB_NATIVE_DIR"
生效环境变量: source ~/.bash_profile


第一节:Hadoop的目录结构


第二节:Hadoop的本地模式
1、特点:不具备HDFS,只能测试MapReduce程序
2、修改hadoop-env.sh  添加如下信息

export JAVA_HOME=/jdk/jdk1.7.0_55
export  HADOOP_HOME=/root/training/hadoop-2.4.1
export  HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export  HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_COMMON_LIB_NATIVE_DIR"

   
3、演示Demo: $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.1.jar
命令:hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount /root/data/input/data.txt  /root/data/output/wc
日志:17/08/04 23:28:38 INFO mapreduce.Job:  map 100% reduce 100%

注意:MR有一个默认的排序规则


第三节:Hadoop的伪分布模式

1、特点:具备Hadoop的所有功能,在单机上模拟一个分布式的环境

         (1)HDFS:主:NameNode,数据节点:DataNode
(2)Yarn:容器,运行MapReduce程序
            主节点:ResourceManager
从节点:NodeManager

2、步骤:
(1)hdfs-site.xml
<!--配置HDFS的冗余度-->
<property>
  <name>dfs.replication</name>
  <value>1</value>
</property>


<!--配置是否检查权限-->
<property>
  <name>dfs.permissions</name>
  <value>false</value>
</property>


(2)core-site.xml
<!--配置HDFS的NameNode-->
<property>
  <name>fs.defaultFS</name>
  <value>hdfs://192.168.88.11:9000</value>
</property>


<!--配置DataNode保存数据的位置-->
<property>
  <name>hadoop.tmp.dir</name>
  <value>/root/training/hadoop-2.4.1/tmp</value>
</property>


(3) mapred-site.xml
<!--配置MR运行的框架-->
<property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>

(4) yarn-site.xml

<!--配置ResourceManager的地址-->  
<property>  
  <name>yarn.resourcemanager.hostname</name>  
  <value>192.168.88.11</value>  
</property>  


<!--配置NodeManager执行任务的方式-->  
<property>  
  <name>yarn.nodemanager.aux-services</name>  
  <value>mapreduce_shuffle</value>  
</property>
<!--其他-->
<property>  
  <name>yarn.resourcemanager.address</name>  
  <value>127.0.0.1:8032</value>  
</property>  
<property>  
  <name>yarn.resourcemanager.scheduler.address</name>  
  <value>127.0.0.1:8030</value>  
</property>  
<property>  
  <name>yarn.resourcemanager.resource-tracker.address</name>  
  <value>127.0.0.1:8031</value>  
</property>


(5)修改hadoop-env.sh  (如果第2小节中已经修改忽略此步奏)
  export JAVA_HOME=/jdk/jdk1.7.0_55
        export  HADOOP_HOME=/root/training/hadoop-2.4.1
 export  HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
 export  HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib:$HADOOP_COMMON_LIB_NATIVE_DIR"

(6) 格式化NameNode

    hdfs namenode -format
日志:Storage directory /root/training/hadoop-2.4.1/tmp/dfs/name has been successfully formatted.



(7) 启动:start-all.sh
           (*) HDFS: 存储数据

           (*) Yarn:执行计算

(8)验证是否启动成功    输入命令jps

   

(8) 访问:

 (*)命令行   

          (*)Java API
   (*)Web Console:
HDFS:http://192.168.88.11:50070

Yarn:http://192.168.88.11:8088

安装完成后遇到问题参考 博客 : http://blog.csdn.net/a639735331/article/details/79238649

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

郝文龙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值