大数据集群是否可以用docker

最新推荐文章于 2024-05-15 14:05:07 发布

guitarCC

最新推荐文章于 2024-05-15 14:05:07 发布

阅读量978

点赞数 1

文章标签： docker 大数据容器

本文链接：https://blog.csdn.net/guitarCC/article/details/126778578

版权

大数据集群能否用docker

1.出生不同
就概念来讲，这个可以去查询官网自己的介绍

hadoop的定义是由软件构建了服务器之间的连接，
每台都提供计算和存储，就是我们说的hadoop的出现依赖于集群

docker的定义是消除频繁重复配置任务快速构建和迁移

这里存在着一点点冲突相比重量级 hadoop就是为重量的场景而生的，附生于硬件消耗
而docker注重轻量化,其出现是为了快速构建程序功能的运行环境,力求简洁的环境,力求环境轻量化
实现功能

2.vmware docker 虚拟化的一些解释

(1)虚拟化谁更原生：
就虚拟化技术来说,vmware尽可能的重量级模仿了真实的物理机,这正是我们需要的。
但是对于虚拟化来说,docker其实更好,因为它虚拟化的解释层比较少,解释的过程少，性能更接近

(2)轻便性
docker 也比 vmware 更便利,因为它只保留了linux内核

(3)隔离性,资源争抢：
vmware 构建了模拟了真实的物理隔离两个虚拟机就是两个独立的操作系统不会相互争抢

docker 构建的隔离是进程别的隔离比如qq和微信会存在性能争抢
(docker里一句话容器及应用启动这个容器就相当于一个应用容器内如果不存在执行的应用
就会自动退出无应用这个容器就不会占用资源启动也会退出）
==> 所以我觉得 vmware 是物理层的模拟 docker 是应用层的模拟)

对于平时来说，docker的安全隔离已经足够了

3.操作手感,真实使用
vmware 确实重,更改虚拟机名字,或者ip,磁盘就是在模仿真实的物理机，
但是这些所谓的操作对于docker来说就是一条命令

如下：
新建并启动hadoop102容器, 并加入到xunqi网络
docker run -d --name xunqi102 --network xunqi centos_java8_ssh:1.0

文件的导入导出其实是物理机和docker应用之间的导入导出都是docker命令
docker cp test.txt 9fa:/

每一个docker为一个进程可以看到创建启动的状态和时间可以停止，对于应用是很友好的

设置太麻烦：docker作为一个及简的操作系统,每一个服务都需要对外暴露,需要手动执行
且网络只能容器互联,做到真的的大数据桥接,需要下载很多工具进行设置

快读构建：docker通过dockerfile进行快速构建
这个快速构建是指的是 mysql你不用装操作系统你也不用装你直接进行拉取镜像仓库
他们的服务是作为一个应用状态对于搭建的操作可以写在dockerfile 相当于对于应用的设置操作
完全被记录且可以执行

但就是太不像物理机了比如 ENV PATH= $JAVA_HOME/bin:$ PATH 声明环境变量

4.是否合适
这就是一个大钱包装大钱小钱包装零花钱谁更合适的问题。虚拟化完全可以让docker支持hadoop
但是你都有虚拟机了为什么还要再用docker装一个虚拟机虚拟出linux,放在里面执行
如果真的想把大数据巨量的存储和计算,权限应用都放在docker里的话。这会是一个及大的存在的“应用”
举个例子蜗牛背上装加速器