hadoop整理(一):hadoop的安装

本文详细介绍Hadoop集群的搭建过程,包括Java JDK的安装、环境变量配置、Hadoop组件安装与配置,以及核心参数调整。同时,文章还介绍了如何关闭Linux防火墙、格式化Hadoop、启动服务,并在Windows上通过HTTP访问HDFS的Web页面。
摘要由CSDN通过智能技术生成

一、安装

  1. 安装Java的jdk

    把bin放到环境变量里 ,即修改 profile文件 vi /etc/profile
    在末端加入:

    export JAVA_HOME = (jdk的路径)
    export PATH= P A T H : PATH: PATH:JAVA_HOME/bin

    使修改生效 : source /etc/profile

  2. 安装hadoop

    在 /etc/hadoop里改配置:

  • slaves
    指定哪些机器启动DataNodes,不设置的话默认有一个localhost

  • hadoop-env.sh
    把export JAVA_HOME的值改死,即改成 /home/…/jdk.1.8.191 这个路径

  • core-site.xml
    指定主节点(NameNode)
    hdfs://hostname:9000 #一般默认端口号就是9000

  • hdfs-site.xml

     	<name>hfs.replication</name> #指定副本数
     	<value>3</value> #一般值为3
    

    除此之外,还可以指定块的大小。

  • mapred-site.xml.template

    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    

    指定MapReduce在yarn上面去跑

  • yarn-site.xml
    yarn.sourcemanager.hostname 指定yarn的老大
    yarn.nodemanager.aux-services 的值为mapreduce_shuffle,这是指定reduce获取数据的方式

  1. 关Linux防火墙
    centos7要使用 systemctl stop firewalld.service #启动用start
    还要禁止开机自动启动防火墙的功能: systemctl disable firewalld.service

  2. 格式化
    第一次启动hadoop的时候要初始化一下
    要把hadoop下的sbin目录也添加到PATH里(bin目录也要)
    格式化命令: hadoop namenode -format

    注:namenode在/data/name里管理主机和块之间的映射关系

  3. 启动
    命令: cd app/hadoop-2.4.1/sbin/
    新手不建议start-all
    所以先 start-dfs.sh再start-yarn.sh

    修改Windows的host文件(在system32/dirvers/etc 里面),把hostname和ip地址加进去)

    修改host文件的方法: 用管理员身份打开命令提示符,输入 notepad, 在记事本里打开host进行修改保存。

    这样我们就可以在Windows上,用 http://hostname:50070 进入HDFS的web页面

    往这里上传文件: hadoop fs -put xxxx.txt hdfs://hostname:9000/ # 末端一定是/,否则出错

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值