基于Docker的Hadoop完全分布式安装

小源er

已于 2024-11-01 22:53:29 修改

阅读量1.6w

点赞数 16

分类专栏： hadoop 大数据 Linux 文章标签：分布式 docker hadoop

于 2018-09-17 00:36:59 首次发布

本文链接：https://blog.csdn.net/sb985/article/details/82722451

版权

之前安装Hadoop是用VMWare创建虚拟机，然后安装伪分布式，因为虚拟机太慢，太卡，实在没有玩下去的心情了，现在想到Docker可以实现虚拟化，看看能不能安装Hadoop,网上查了查，果然可以，并且博客还不少，但都是有些小问题，并且过程不详细，没有问题解决的答案，在我踩了好多坑后，现在记录一下我在基于Docker的Hadoop完全分布式安装时的过程和遇到的问题，希望能帮到后来的童鞋．

首先，Docker是啥

我也解释不清，不要怼我，因为我只是了解了一小部分，只是会用而已，据说很牛逼，其实就是个基于Linux文件系统的虚拟化软件，基础是 Linux 容器（LXC）等技术，可以虚拟出一套独立于宿主机环境的开发环境（命名空间）．如果你想具体了解请自行百度，一般云计算，运维都会学docker的，这里只要会用就行．

安装docker

sudo apt-get install docker

我这里是ubuntu16.04,不同的环境可能还要安装其他软件，请自行百度．对于linux的用户，直接install docker就行，其他的软件依赖会显示的，你在安装即可．这一步一般不会有问题的．

Docker去sudo

在Ubuntu下，在执行Docker时，每次都要输入sudo，解决方法就是把当前用户执行权限添加到相应的docker用户组里面。

sudo groupadd docker；// 添加一个新的docker用户组
sudo gpasswd -a username docker	//添加当前用户到docker用户组里
sudo service docker restart //重启Docker后台监护进程
docker ps 试试，如果没有实现当前运行的容器，则系统重启，则生效
sudo reboot

下拉镜像并运行

因为国内网络环境，镜像的获取会非常慢，尽管docker在大陆建立的镜像，但还是慢，这里可以用国内的镜像，分别有网易的蜂巢，阿里云，daocloud,其实如果你不提交镜像的话，用docker官方在境内的服务器也是可以的，我这里用了docker官方的镜像
这里永久性保留更改，修改 /etc/docker/daemon.json 文件并添加上 registry-mirrors 键值。
{
“registry-mirrors”: [“https://registry.docker-cn.com”]
}
修改保存后重启 Docker 以使配置生效。
然后执行