【Hadoop】基于Docker搭建集群环境

本文详细介绍了如何使用Docker构建Hadoop完全分布式集群,包括更新APT、安装Vim、SSH、JDK,以及配置Hadoop、HBase、Hive、Kafka和Flume等组件。通过创建和保存Docker镜像,实现多节点无密码登陆的集群环境。
摘要由CSDN通过智能技术生成

Docker-Hadoop集群

1. Hadoop完全分布式集群步骤总结


本篇博文主要是1-6的步骤。

  1. 更新apt ——APT是Advanced Packaging Tool的缩写,是一款强大的包管理工具,也可以称作机制,通过终端安装软件一般是使用apt instll 命令
  1. 安装vim —— 文本编辑器,是编辑环境变量以及配置文件最常用的文本编辑器
  1. 安装sshd —— 无密码登陆服务,用于集群各节点之间的无密码访问
  1. 安装JDK —— Hadoop的底层HDFS和MapReduce都是基于Java语言实现的,所以需要JVM环境
  1. 下载Hadoop集群相关资源,并设置配置文件
  1. 做好以上准备工作后,将当前的容器保存为一个新镜像
  1. 以新镜像开启所需的节点个数,每个节点作为集群的一个节点
  1. 创建容器后,测试ssh是否有效,各节点之间必须支持无密码登陆
  1. 配置各节点的 etc/hosts 文件,设置主机名与IP之间的映射
  1. 在多个节点中挑选一个节点作为Master节点,其他节点则作为Slave节点
  1. 在主节点中配置集群的副节点 在主节点中修改Hadoop下的./etc/hadoop/workers (当前是Hadoop 3.x.x版本 ,之前的版本是slave文件)
  1. 在主节点启动集群,首次启动需初始化Namenode
  1. JPS查看进程,主节点包括NameNode、SecondaryNamenode、ResourceManager,副节点包括NodeManager和DataNode
  1. 在HDFS创建目录,并上传Hadoop下的配置文件,测试运行分布式实例,查询HDFS里的结果文本

2. 集群环境前的准备


准备Ubuntu镜像

sudo docker pull ubuntu

创建Docker内部传输文件目录

sudo mkdir /usr/local/dockerbuild

创建容器

sudo docker run -it -v /usr/local/dockerbuild:/root/build/ --name pc1 ubuntu

2.1 安装 Vim 更新 APT


先安装好vim之后再修改镜像源

apt-get update
apt-get install vim

在这里插入图片描述

设置系统镜像源,使用apt-get install 安装软件会更快

参考资料:https://developer.aliyun.com/mirror/ubuntu?spm=a2c6h.13651102.0.0.3e221b11KruDiG

【1】 备份系统原镜像文件 sources.list后删除原文件

cd /etc/apt
cp sources.list sources.list.bak
rm -rf sources.list
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值