hadoop平台搭建（2.6.0）

最新推荐文章于 2024-08-16 13:24:37 发布

svmachine

最新推荐文章于 2024-08-16 13:24:37 发布

阅读量1.1k

点赞数

分类专栏： hadoop 文章标签： hadoop

本文链接：https://blog.csdn.net/svmachine/article/details/51334188

版权

hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

最近闲来无事搭建了一个hadoop环境，将搭建步骤记录一下。
一.环境准备

环境：VMware,xshell
OS: Ubuntu server(选择最简安装，只安装OpenSSH-Server)
版本：hadoop-2.6.0
三个节点：

 192.168.16.131      master
 192.168.16.132      node1
 192.168.16.133      node2

编辑/etc/hosts文件

将节点信息添加进去（如上）

建立hadoop运行账号：

groupadd hadoop               //设置hadoop用户组
useradd –s /bin/bash –d /home/wh –m wh –g hadoop –G admin //添加一个wh用户，此用户属于hadoop用户组，且具有admin权限。
passwd wh                    //设置用户zhm登录密码
su wh                        //切换到wh用户中

设置权限修改sudoers

chmod u+w /etc/sudoers

vim  /etc/sudoers (添加如下东西)
   wh ALL=(ALL:ALL) ALL

chmod u-w /etc/sudoers

`二.安装jdk（选择7）
1.安装

apt-get install openjdk-7-jdk

2.环境配置

编辑 .bashrc

vim .bashrc

JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64（默认安装位置）

添加/etc/profile

chmod u+w /etc/profile(给予修改权限）

vim /etc/profile
#末尾添加以下配置：
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
export JRE_HOME=/usr/lib/jvm/java-7-openjdk-amd64/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

chmod u-w /etc/profile(权限回收）

查看是否安装成功

java -version

三.SSH无密码登录
1.生成master公匙

ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cd .ssh

2.让节点需能无密码 SSH 本机，在节点上执行：

cat id_rsa.pub >> authorized_keys

3.使用ssh localhost检查是否能登录自身（三个都用）

4.使用master节点ssh另外两个节点
在node1,node2节点执行：

scp wh@master:~/.ssh/id_dsa.pub ./master_dsa.pub
cat master_dsa.pub >> authorized_keys

5.测试是否成功

在master节点

ssh  node1(node2)

注意：第一次需要输入node1(node2)节点密码，第二次不用。

四.配置hadoop-2.6.0

下载hadoop-2.6.0:http://pan.baidu.com/s/1c24XcEs
通过Xftp将文件从windows传入Ubuntu 解压到/home/wh下
修改core-site.xml(都在/home/wh/hadoop/etc/hadoop/下）：

<configuration>
   <property>
      <name>fs.defaultFS</name>
      <value>hdfs://master:9000</value>
   </property>
   <property>
      <name>hadoop.tmp.dir</name>
      <value>file:/home/wh/hadoop/tmp</value>
      <description>Abase for other temporary directories.</description>
   </property>
</configuration>

修改hdfs-site.xml

<configuration>
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>master:50090</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/home/wh/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/home/wh/hadoop/tmp/dfs/data</value>
    </property>
</configuration>

修改mapred-site.xml(cp mapred-site.xml.template mapred-site.xml)

<configuration>
   <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
   </property>
   <property>
      <name>mapreduce.jobhistory.address</name>
      <value>master:10020</value>
   </property>
   <property>
      <name>mapreduce.jobhistory.webapp.address</name>
      <value>master:19888</value>
   </property>
</configuration>

修改yarn-site.xml

<configuration>
   <property>
      <name>yarn.resourcemanager.hostname</name>
      <value>master</value>
   </property>
   <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
   </property>
</configuration>

修改slaves(删除localhost)

node1
node2

修改hadoop-env.sh

 JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

将hadoop文件复制到各个节点,并在slaves节点执行解压操作：

tar -zcf ~/hadoop.master.tar.gz ./hadoop 
scp ./hadoop.master.tar.gz node1:/home/wh
sudo tar -zxf ~/hadoop.master.tar.gz -C /home/wh

启动hadoop(首次启动需要master执行namenode的格式化）：

bin/hdfs namenode -format

启动hadoop：

sbin/start-dfs.sh
sbin/start-yarn.sh
sbin/mr-jobhistory-daemon.sh start historyserver

通过命令 jps 可以查看各个节点所启动的进程。正确的话，在 Master 节点上可以看到
NameNode、ResourceManager、SecondrryNameNode、JobHistoryServer 进程在 Slave
节点可以看到 DataNode 和 NodeManager 进程.

五.运行hadoop实例

 bin/hdfs dfs -mkdir -p /user/wh

将 /usr/local/hadoop/etc/hadoop 中的配置文件作为输入文件复制到分布式文件系统中：

bin/hdfs dfs -mkdir input
bin/hdfs dfs -put /home/wh/hadoop/etc/hadoop/*.xml input

运行mapreduce作业：

hadoop jar /home/wh/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'

通过http://192.168.16.131:8088查看datanode状态或者通过bin/hdfs dfs -cat output/*查看输出结果

六.关闭hadoop

sbin/stop-yarn.sh
sbin/stop-hdfs.sh
sbin/mr-jobhistory-daemon.sh stop historyserver

svmachine

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop平台搭建（2.6.0）

最近闲来无事搭建了一个hadoop环境，将搭建步骤记录一下。一.环境准备环境：VMware,xshellOS: Ubuntu server(选择最简安装，只安装OpenSSH-Server)版本：hadoop-2.6.0三个节点： 192.168.16.131 master 192.168.16.132 node1 192.168.16.133 nod
复制链接

扫一扫

专栏目录