为什么不建议把数据库部署在Docker容器内

最新推荐文章于 2024-04-26 19:52:36 发布

架构师小秘圈

最新推荐文章于 2024-04-26 19:52:36 发布

阅读量157

点赞数

文章标签：数据库分布式算法 java mysql

原文链接：https://mp.weixin.qq.com/s/ciRL4YGRz4cLy1JuxNw92Q#rd

版权

近几年Docker非常的火热，各位开发者恨不得把所有的应用、软件都部署在Docker容器中，但是您确定也要把数据库也部署的容器中吗？这个问题不是子虚乌有，因为在网上能够找到很多各种操作手册和视频教程，这里整理了一些数据库不适合容器化的原因供大家参考，同时也希望大家在使用时能够谨慎一点。目前为止将数据库容器化是非常不合理的，但是容器化的优点相信各位开发者都尝到了甜头，希望随着技术的发展能够更加完美的解决方案出现。

Docker不适合部署数据库的7大原因

数据安全问题

不要将数据储存在容器中，这也是Docker官方容器使用技巧中的一条。容器随时可以停止、或者删除。当容器被rm掉，容器里的数据将会丢失。为了避免数据丢失，用户可以使用数据卷挂载来存储数据。但是容器的Volumes设计是围绕Union FS镜像层提供持久存储，数据安全缺乏保证。如果容器突然崩溃，数据库未正常关闭，可能会损坏数据。另外，容器里共享数据卷组，对物理机硬件损伤也比较大。即使你要把Docker数据放在主机来存储，它依然不能保证不丢数据。使用当前的存储驱动程序，Docker仍然存在不可靠的风险。如果容器崩溃并数据库未正确关闭，则可能会损坏数据。

性能问题

大家都知道，MySQL属于关系型数据库，对IO要求较高。当一台物理机跑多个时，IO就会累加，导致IO瓶颈，大大降低MySQL的读写性能。在一次Docker应用的十大难点专场上，某国有银行的一位架构师也曾提出过：“数据库的性能瓶颈一般出现在IO上面，如果按Docker的思路，那么多个docker最终IO请求又会出现在存储上面。现在互联网的数据库多是share nothing的架构，可能这也是不考虑迁移到Docker的一个因素吧”。

针对性能问题有些同学可能也有相对应的方案来解决：

数据库程序与数据分离，如果使用Docker跑MySQL，数据库程序与数据需要进行分离，将数据存放到共享存储，程序放到容器里。如果容器有异常或MySQL服务异常，自动启动一个全新的容器。另外，建议不要把数据存放到宿主机里，宿主机和容器共享卷组，对宿主机损坏的影响比较大。
跑轻量级或分布式数据库，Docker里部署轻量级或分布式数据库，Docker本身就推荐服务挂掉，自动启动新容器，而不是继续重启容器服务。
合理布局应用，对于IO要求比较高的应用或者服务，将数据库部署在物理机或者KVM中比较合适。目前TX云的TDSQL和阿里的Oceanbase都是直接部署在物理机器，而非Docker。

网络问题

要理解Docker网络，您必须对网络虚拟化有深入的了解。数据库需要专用的和持久的吞吐量，以实现更高的负载。未解决的Docker网络问题在1.9版本依然没有得到解决。把这些问题放在一起，容器化使数据库容器很难管理。你需要花多少时间解决Docker网络问题？将数据库放在专用环境不会更好吗？节省时间来专注于真正重要的业务目标。

状态

在Docker中打包无状态服务是很酷的，可以实现编排容器并解决单点故障问题。但是数据库呢？将数据库放在同一个环境中，它将会是有状态的，并使系统故障的范围更大。下次您的应用程序实例或应用程序崩溃，可能会影响数据库。知识点：在Docker中水平伸缩只能用于无状态计算服务，而不是数据库。Docker快速扩展的一个重要特征就是无状态，具有数据状态的都不适合直接放在Docker里面，如果Docker中安装数据库，存储服务需要单独提供。目前，TX云的TDSQL（金融分布式数据库）和阿里云的Oceanbase（分布式数据库系统）都直接运行中在物理机器上，并非使用便于管理的Docker上。

资源隔离

资源隔离方面，Docker确实不如虚拟机KVM，Docker是利用Cgroup实现资源限制的，只能限制资源消耗的最大值，而不能隔绝其他程序占用自己的资源。如果其他应用过渡占用物理机资源，将会影响容器里MySQL的读写效率。需要的隔离级别越多，获得的资源开销就越多。相比专用环境而言，容易水平伸缩是Docker的一大优势。然而在Docker中水平伸缩只能用于无状态计算服务，数据库并不适用。我们没有看到任何针对数据库的隔离功能，那为什么我们应该把它放在容器中呢？

云平台的不适用性

大部分人通过共有云开始项目。云简化了虚拟机操作和替换的复杂性，因此不需要在夜间或周末没有人工作时间来测试新的硬件环境。当我们可以迅速启动一个实例的时候，为什么我们需要担心这个实例运行的环境？这就是为什么我们向云提供商支付很多费用的原因。当我们为实例放置数据库容器时，上面说的这些便利性就不存在了。因为数据不一致，新实例不会与老实例兼容，如果要限制实例使用单机服务，应该让DB使用非容器化环境，我们仅仅需要为计算服务层保留弹性扩展的能力。

运行数据库的环境需求

常看到DBMS容器和其他服务运行在同一主机上。然而这些服务对硬件要求是非常不同的。数据库（特别是关系型数据库）对IO的要求较高。一般数据库引擎为了避免并发资源竞争而使用专用环境。如果将你的数据库放在容器中，那么将浪费你的项目的资源。因为你需要为该实例配置大量额外的资源。在公有云，当你需要34G内存时，你启动的实例却必须开64G内存。在实践中，这些资源并未完全使用。怎么解决？您可以分层设计，并使用固定资源来启动不同层次的多个实例。水平伸缩总是比垂直伸缩更好。

总结

针对上面问题是不是说数据库一定不要部署在容器里吗？答案是：并不是我们可以把数据丢失不敏感的业务（搜索、埋点）就可以容器化，利用数据库分片来来增加实例数，从而增加吞吐量。Docker适合跑轻量级或分布式数据库，当Docker服务挂掉，会自动启动新容器，而不是继续重启容器服务。数据库利用中间件和容器化系统能够自动伸缩、容灾、切换、自带多个节点，也是可以进行容器化的。

特别推荐一个分享架构+算法的优质内容，还没关注的小伙伴，可以长按关注一下：

长按订阅更多精彩▼

如有收获，点个在看，诚挚感谢

架构师小秘圈

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
为什么不建议把数据库部署在Docker容器内

近几年Docker非常的火热，各位开发者恨不得把所有的应用、软件都部署在Docker容器中，但是您确定也要把数据库也部署的容器中吗？这个问题不是子虚乌有，因为在网上能够找到很多各种操作手...
复制链接

扫一扫