Docker 安装hadoop

一、实验环境(实验设备)

硬件:单核CPU、内存1G 软件:Ubuntu 16.04操作系统、Docker、Hadoop

二、实验原理及内容

1.在Ubuntu系统中安装Docker

Apt install docker

复制代码

 

Apt-get install docker.io
复制代码

 

2.Docker 安装 hadoop

1).查找hadoop 镜像

 

2)将镜像pull下

 

3)通过docker images命令查看hadoop镜像是否pull成功

 

4)先通过命令

docker run -i -t --name Master -h Master  -p 50070:50070 sequenceiq/hadoop-docker /bin/bash
复制代码

运行一个hadoop镜像作为hadoop集群的namenode

 

再分别创建两个该hadoop集群的datanode

docker run -i -t --name Slave1 -h Slave1 sequenceiq/hadoop-docker /bin/bash
docker run -i -t --name Slave2 -h Slave2 sequenceiq/hadoop-docker /bin/bash
复制代码

 

这样hadoop的集群环境搭建完成。

3.hadoop三个节点之间无秘ssh配置

1)进入Master容器里面运行/etc/init.d/sshd start开启ssh,然后使用命令ssh-keygen -t rsa生成秘钥,最后将秘钥保存到authorized_keys中。

 

其余结点做相同操作。 进入3者查看ip信息 Master

 

Slave1

 

Slave2

 

4.hadoop的配置 由于hadoop集群环境已经搭建完成,我们只需更改Master节点上的hadoop配置文件,然后使用scp命令发送到其余各节点进行覆盖配置。 1)core-site.xml 配置

 

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://had0:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/data/hadoopdata</value>
    </property>
</configuration>
复制代码

2)hdfs-site.xml配置

 

<property>
        <name>dfs.namenode.name.dir</name>
        <value>/home/data/hadoopdata/name</value>
    </property>
&emsp;&emsp;<!--配置存储namenode数据的目录-->
&emsp;&emsp;<property>
        <name>dfs.datanode.data.dir</name>
        <value>/home/data/hadoopdata/data</value>
    </property>
&emsp;&emsp;<!--配置存储datanode数据的目录-->
&emsp;&emsp;<property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
&emsp;&emsp;<!--配置部分数量-->
复制代码

3)mapred-site.xml配置

 

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>&emsp;&emsp;<!--配置mapreduce任务所在的资源调度平台-->
</configuration>
复制代码

4)yarn-site.xml配置

 

<configuration>
<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>slave1</value>
    </property>
    <!--配置yarn主节点-->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <!--配置执行的计算框架-->
</configuration>
复制代码

然后使用命令scp将该配置分发到其余两个节点,至此hadoop的配置完成

 

5.hadoop的运行 在Master中进入/usr/local/hadoop-2.7.0/sbin文件夹下执行命令./start-all.sh来启动该hadoop集群

 

成功启动之后使用命令jps查看是否启动

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
使用Docker安装Hadoop的步骤如下: 1. 安装Docker并获取centos镜像。 2. 配置容器的IP,并为容器安装SSH。 3. 安装Java和Hadoop。 4. 配置Hadoop。 5. 在master节点启动Hadoop,从节点会自动启动初始化。 6. 分别启动各个组件,包括namenode、datanode、yarn和historyserver。 7. 进行测试,可以使用hadoop安装包中提供的示例程序,对文件进行测试。 8. 可以在各个主机上使用jps命令来查看Hadoop的状态。 具体的命令示例如下: 1. 安装Docker并获取centos镜像。 2. 配置容器的IP并安装SSH。 3. 安装Java和Hadoop。 4. 配置Hadoop。 5. 在master节点启动Hadoop,从节点会自动启动初始化。 6. 启动各个组件,包括namenode、datanode、yarn和historyserver。 7. 进行测试,使用hadoop安装包中提供的示例程序对文件进行测试。 8. 使用jps命令在每台主机上查看Hadoop的状态。 请注意,以上仅为简要步骤说明,具体安装和配置过程可能因不同的环境和要求而有所不同。我建议参考具体的安装文档和教程以获取更详细的信息和指导。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [使用docker搭建Hadoop](https://blog.csdn.net/tian1345/article/details/109511799)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值