大数据集群是否可以用docker

大数据集群能否用docker

1.出生不同
就概念来讲,这个可以去查询官网自己的介绍

hadoop的定义是由软件构建了服务器之间的连接,
每台都提供计算和存储,就是我们说的hadoop的出现依赖于集群

docker的定义是 消除频繁重复配置任务 快速构建和迁移

这里存在着一点点冲突 相比重量级 hadoop就是为重量的场景而生的,附生于硬件消耗
而docker注重轻量化,其出现是为了快速构建程序功能的运行环境,力求简洁的环境,力求环境轻量化
实现功能

2.vmware docker 虚拟化的一些解释

(1)虚拟化谁更原生:
就虚拟化技术来说,vmware尽可能的重量级模仿了真实的物理机,这正是我们需要的。
但是对于虚拟化来说,docker其实更好,因为它虚拟化的解释层比较少,解释的过程少,性能更接近

(2)轻便性
docker 也比 vmware 更便利,因为它只保留了linux内核

(3)隔离性,资源争抢:
vmware 构建了模拟了真实的物理隔离 两个虚拟机就是两个独立的操作系统 不会相互争抢

docker 构建的隔离是进程别的隔离 比如qq和微信 会存在性能争抢
(docker里一句话 容器及应用 启动这个容器就相当于一个应用 容器内如果不存在执行的应用
就会自动退出 无应用 这个容器就不会占用资源 启动也会退出)
==> 所以我觉得 vmware 是物理层的模拟 docker 是应用层的模拟)

对于平时来说,docker的安全隔离 已经足够了

3.操作手感,真实使用
vmware 确实重,更改虚拟机名字,或者ip,磁盘 就是在模仿真实的物理机,
但是这些所谓的操作对于docker来说 就是一条命令

如下:
新建并启动hadoop102容器, 并加入到xunqi网络
docker run -d --name xunqi102 --network xunqi centos_java8_ssh:1.0

文件的导入导出 其实是 物理机和docker应用之间的导入导出 都是docker命令
docker cp test.txt 9fa:/

每一个docker为一个进程 可以看到创建 启动的状态和时间可以停止,对于应用是很友好的

设置太麻烦:docker作为一个及简的操作系统,每一个服务都需要对外暴露,需要手动执行
且网络只能容器互联,做到真的的大数据桥接,需要下载很多工具进行设置

快读构建:docker通过dockerfile进行快速构建
这个快速构建 是指的是 mysql你不用装 操作系统你也不用装 你直接进行拉取 镜像仓库
他们的服务是作为一个应用状态 对于搭建的操作可以写在dockerfile 相当于对于应用的设置操作
完全被记录且可以执行

但就是太不像物理机了 比如 ENV PATH= J A V A H O M E / b i n : JAVA_HOME/bin: JAVAHOME/bin:PATH 声明环境变量

4.是否合适
这就是一个 大钱包装大钱 小钱包装零花钱谁更合适的问题。虚拟化完全可以让docker支持hadoop
但是你都有虚拟机了 为什么还要再用docker装一个虚拟机 虚拟出linux,放在里面执行
如果真的想把大数据巨量的存储和计算,权限应用都放在docker里的话。这会是一个及大的存在的“应用”
举个例子 蜗牛背上装加速器

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值