目的
1 假设有某个客户创建过千万文件目录,可以导致 ceph-mds 故障
2 backup ceph-mds 拉起时需要从内存中 replay 最后操作,可能需要吧当前目录中所有目> 录结构 重新 reload 至内存
3 这个过程可能需要几小时,可能需要几天
4 为了快速地拉起 ceph-mds
5 可以选择配置一个 ceph-mds standby replay 机制
6 机制用于每个 active mds 都配置一个备用 mds,并且同步 acitvice mds 中内存数据至 standby mds
7 可以在 active mds 故障时快速地拉起 backup mds
结论
优点
1 可以在 active mds 故障时候快速切换并替换 actieve 继续为 cephfs 提供服务
缺点
1 由于 active mds 时刻都需要复制数据至 standby replay mds, 对于性能会有一定损耗
2 测试过程中, 发现损耗约 1/5 性能,文件目录写入慢 1/5
3 在一个目录中创建大量文件目录后,整体性能会线性下降, 因此需要合理分配文件目录结构
常规 MDS 状态
参考使用 standby replay 前 ceph mds 状态
# ceph -c /etc/ceph/vip-ceph.conf fs status
5_mds_test - 0 clients
=======