分片就是将数据库进行拆分,将数据集合分隔到不同服务器上。例如将100G的数据,可以分割成10份存储到10台服务器上,这样每台机器只有10G的数据。
通过一个mongos进程(路由)实现分片后的数据存储与访问,也就是说mongos是整个分片架构的核心,对客户端而言无法感知是否有分片的,客户端只需要把读写操作转达给mongo即可。
虽然分片会把数据分隔到多台服务器上,但是每一个节点都需要有一个备份,这样能保证数据的高可用。
当系统需要更多空间或者资源的时候,分片可以让我们按需扩展,只需要把mongodb服务的机器加入到分片集群中即可
MongoDB分片相关概念
mongos: 数据库集群请求的入口,所有的请求都通过mongos进行协调,不需要在应用程序添加一个路由选择器,mongos自己就是一个请求分发中心,它负责把对应的数据请求请求转发到对应的shard服务器上。在生产环境通常有多mongos作为请求的入口,防止其中一个挂掉所有的mongodb请求都没有办法操作。
config server: 配置服务器,存储所有数据库元信息(路由、分片)的配置。mongos本身没有物理存储分片服务器和数据路由信息,只是缓存在内存里,配置服务器则实际存储这些数据。mongos第一次启动或者关掉重启就会从 config server 加载配置信息,以后如果配置服务器信息变化会通知到所有的 mongos 更新自己的状态,这样 mongos 就能继续准确路由。在生产环境通常有多个 config server 配置服务器,因为它存储了分片路由的元数据,防止数据丢失!
shard: 存储了一个集合部分数据的MongoDB实例,每个分片是单独的mongodb服务或者副本集,在生产环境中,所有的分片都应该是副本集。