什么是 MongoDB 复制集
1.什么是复制集
Mongodb复制集由一组Mongod实例(进程)组成,包含一个Primary节点和多个Secondary节点,Mongodb Driver(客户端)的所有数据都写入Primary,Secondary从Primary同步写入的数据,以保持复制集内所有成员存储相同的数据集,提供数据的高可用。
2.复制集的作用
-
MongoDB 复制集的主要意义是在于实现服务高可用
-
它的实现依赖于两个方面的功能
- 数据写入时将数据迅速复制到另一个独立节点上
- 在接受写入的节点发生故障时自动选举出一个新的代替节点
-
在实现高可用得到同时,复制集实现了其他几个附加作用
- 数据分发:将数据从一个区域复制到另一个区域,减少另一个区域的读延迟
- 读写分离:不同类型的压力分别在不同的节点上执行
- 异地容灾:在数据中心故障时快速切换到异地
3.典型复制集结构
一个典型的复制集由3个及以上具有投票权的节点组成,包括:
- 一个主节点(Primary):接受写入操作和选举时投票
- 两个或者多个从节点(Secondary):复制主节点上的新数据和选举时投票
- 不推荐使用 Arbiter(投票节点)
- 此节点没有数据,只是用来做投票
4.数据如何复制的?
- 当一个修改操作,无论是插入、更新或者删除,到达主节点时,它对数据的操作将被记录下来(经过一些必要的转换),这些记录称为 oplog。
- 从节点通过在主节点上打开一个 tailable 游标不断获取新进入主节点的 oplog,并在自己的数据上回放,从此保持跟主节点的数据一致。
5.故障恢复
RAFT 算法:https://raft.github.io/
通过选举完成故障恢复
- 具有投票权的节点之间两两互相发送心跳
- 当 5 次心跳未收到时判断为节点失联
- 如果失联的是主节点,从节点会发起选举,选出新的主节点
- 如果失联的是从节点,则不会产生新的选举
- 选举基于 RAFT 一致性算法实现,选举成功的必要条件是大多数投票节点存活
- 复制集中最多可以有 50 个节点,但具有投票权的节点最多 7 个
6.影响选举的因素
- 整个集群必须有大多数节点存活
- 被选举为主节点的节点必须
- 能够与多数节点建立连接
- 具有较新的 oplog
- 具有较高的优先级(如果有配置)
7.常见选项
- 复制集及诶单有以下常见的选配项
- 是否具有投票权(v 参数):有则参与投票
- 优先级(priority参数):优先级越高的节点,越优先成为主节点。优先级为 0 的节点无法成为主节点
- 隐藏(hidden参数):复制数据,但对应用不可见。隐藏及诶单可以具有投票权,但优先级必须为 0
- 延迟(slaveDelay 参数):复制 n 秒之前的数据,保存与主节点的时间差。
- 比如可以设置一个延迟12个小时的节点,如果主节点不小心进行了误操作,12小时内还可以从这个延迟节点,拿到被误删除的数据
8.复制集注意事项
- 关于硬件
- 因为正常的复制集节点都有可能成为主节点,它们的地位是一样的,因此硬件配置上必须一致
- 为了保证节点不会同时宕机,各节点使用的硬件必须具有独立性
- 关于软件
- 复制集各节点软件版本必须一致,避免出现不可预知的问题
- 增加节点不会增加系统写性能
9.参考
- 《MongoDB高手课》- 唐建法