参考文档:
https://docs.mongodb.com/
mongodb的分片是一种将数据打算分配到不同机器上的方法。通过分片,mongodb能够做到大数据量的批量操作。
一般来讲,应对业务快速发展,有两种方式:水平扩展、垂直扩展。
垂直扩展,就是提升单台服务器的性能,如更多核的处理器、更大的内存、更大的存储空间。硬件工艺的不足会限制一台服务器的性能到一个极限后,无法在扩大。
水平扩展:是将数据进行分割,并分配到多台servers上,只需要增加server的数目,就可以完成扩展。这样的成本要比增加处理器、增加内存、增加存储要低很多。相应的在基础设施和部署上的运维复杂度增大了。
mongodb的分片技术叫做sharding
mongodb的sharded cluster包含三个组件:
1 shard 存放分片后的数据
2 mongos 是query route的作用,为客户端程序和shard cluster提供中间层。
3 config servers 包含元数据和配置信息。从mongodb 3.4开始config servers必须被部署为replication sets的方式。(CSRS) 如下:
mongodb以collection的级别打散数据,将collections的数据打散到各个server上。
shard keys 分片的依据。一旦选择,无法改变。一个shard collection只能有一个shard key.
如果要分片的collection已经存在数据,那么在分片前,shard key上必须有索引。如果是空的collection,则mongodb会自动建立索引。
分片策略:
1 哈希分片
先给shard key算出一个哈希值,之后根据这个哈希值进行范围分片。
2 范围分片