MongoDB分片（Sharding）集群（Cluster）

最新推荐文章于 2024-06-28 14:57:20 发布

Clement-Xu

最新推荐文章于 2024-06-28 14:57:20 发布

阅读量1.7k

点赞数

分类专栏： MongoDB 数据库文章标签： mongodb sharding 集群

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/clementad/article/details/50698392

版权

数据库同时被 2 个专栏收录

19 篇文章 0 订阅

订阅专栏

12 篇文章 0 订阅

订阅专栏

单数据量大或者吞吐量大到一定程度的时候，一个服务器已经无法支撑了——频繁的查询会耗尽CPU资源、不断增多的数据会耗尽硬盘空间、不断增大的工作空间（包括索引）会耗尽内存最终导致虚拟内存（磁盘）的使用、等等。解决的方法就是把数据分布到多个不同的服务器中，如下图所示。

具体的实现：MongoDB通过下图所示的分片集群的方法实现：

其中：

Shard：存储数据的一个分片。可以是一个mongod实例、或一个replica set（生产环境中）。
Query Router（mongos）：提供给客户端操作MongoDB cluster的接口。一个cluster可以有多个mongos。它缓存了Config Server中的路由数据（metadata），当数据有更新时缓存会被刷新。一般和客户端部署在同一个服务器上。
Config Server：保存数据分片规则（对应关系）的元数据（metadata），mongos使用这些配置数据来访问具体的某个shard。从3.2版本开始，Config Server可以是一个replica set。

数据分片的方法：

按照连续的一个区间分片：
- 优点：对应区间查询，可以在一个shard中命中，提高效率
- 缺点：数据分片可能很不均衡
哈希分片：
- 优点：数据分片很均匀
- 缺点：对于区间查询，效率不高

维持各个分片的数据均衡：

MongoDB会启动两个后台进程来维持各个分片之间的数据均衡。重新均衡的同时，需要更新Config Server中的metadata，以便Router可以正确路由读写请求。

Splitter：这个进程把一个shard中的数据分块（chunk，缺省是64M/chunk），如果一个chunk增长到超过最大值，新的insert或update操作会触发分块，如下图所示：

Balancer：这个进程用于维持各个shard中的chunk个数均衡，如果不均衡（Splitter分块之后，会导致不均衡），它就从个数多的shard中移动一些到个数少的shard中，如下图所示：

新增一个shard的时候，balancer就会开始迁移一些chunk过去；删除一个shard的时候，balancer会把这个shard中的所有chunk迁移到其他shard中，迁移结束后就可以安全的移除这个shard了。

把一个正在使用的Stand-alone的replica set 升级转换成一个分片集群的具体步骤：

https://docs.mongodb.org/manual/tutorial/convert-replica-set-to-replicated-shard-cluster/

相反地，把一个分片聚群转为一个Stand-alone的replica set的步骤：

https://docs.mongodb.org/manual/tutorial/convert-sharded-cluster-to-replica-set/

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。