搭建Hadoop的伪分布模式

搭建Hadoop的伪分布模式

    通过修改Hadoop安装目录下的配置文件来搭建


    1、hdfs-site.xml -> 配置HDFS

            数据块的冗余度,默认为3,因为搭建的是伪分布环境只有一个数据节点所以配置为1,一般来说数据块的冗余度和数据节点是一致的,但是最大不要超过3,超过3后就没有实际意义了

            

    2、core-site.xml -> 配置HDFS

<!--主节点NameNode的地址-->
<property>
<name>fs.defaultFS</name>
<!--主机名(ip)的地址-->
<value>hdfs://bigdata11:9000</value>
</property>

                <!--HDFS数据保存的目录,默认是Linux的tmp目录(一定要重新配置,因为Linux的tmp目录重启后里面的数据会被清空)-->
<property>
<name>hadoop.tmp.dir</name>
<value>/root/training/hadoop-2.7.3/tmp</value>
</property>

        3、mapred-site.xml -> 配置运行MapReduce的环境Yarn

                mapred-site.xml -> 默认没有,有个模板文件名,需要拷贝一份后缀名修改为.xml, MapReduce 不能独立运行,必须要部署到Yarn容器当中

                

                <!--MR程序运行的容器是Yarn-->
<property>
  <!--mapreduce.framework.name 运行框架 yarn-->
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>

        4、yarn-site.xml -> 配置运行MapReduce的容器Yarn

                <!--主节点ResourceManager的地址-->
<property>
  <name>yarn.resourcemanager.hostname</name>
  <value>bigdata11</value>
</property>
<!--从节点NodeManager运行MR任务的方式-->
<property>
  <name>yarn.nodemanager.aux-services</name>
  <!--mapreduce_shuffle 洗牌,整个MapReduce的核心-->
  <value>mapreduce_shuffle</value>
</property>

配置完成后,对NameNode进行格式化 

    hdfs namenode -format

出现这句话就说明配置成功

    

可以使用 start-all.sh 启动查看,然后照着提示输入 yes 和 密码,完成后输入 jps 查看启动结果,出现下面的信息就说明搭建成功


完成后下一篇文章讲如何配置免密码登录启动和伪分布环境下的实例操作,不然光是启动一台机器就够费劲的了

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值