DB2 HADR最佳实践指南
1. 缓解网络拥塞问题
在DB2的高可用性灾难恢复(HADR)环境中,网络拥塞可能会影响系统性能。可以通过调整TCP/IP网络来增加其缓冲,同时增大 DB2_HADR_BUF_SIZE 注册表变量的值,以增加备用服务器上的日志接收缓冲区。不过,如果主服务器的日志生成速率持续高于备用服务器的处理能力,增大缓冲区也无济于事。当出现拥塞时, Snapshot™ 或 db2pd 会将连接状态报告为“congested”, hadr_connect_status 监控元素也会报告拥塞情况。
2. 避免使用HA集群软件的HADR数据丢失
使用HA集群软件的HADR会自动执行接管过程。若检测到网络错误,主数据库将进入断开连接状态,但事务仍可继续进行,这能最大程度保证HADR数据库的可用性。然而,在数据库处于断开连接状态时提交的事务不会传输到备用数据库,仅存在于主数据库中。若主数据库在网络恢复前崩溃,自动接管过程将启动,备用数据库会强制接管主数据库,未传输到备用数据库的日志记录会丢失。
为避免数据丢失,仅当主数据库崩溃时HADR处于对等(Peer)状态,才应执行自动故障转移。在执行HADR接管前,需确保HADR处于对等状态,即SYNC或NSYNC模式下数据库之间无日志差距。ASYNC模式因其特性无法保证数据库完整性,这里不做讨论。
可通过以下步骤避免数据丢失:
1. 监控主数据库的diag.log :需立即检测HADR状态变为断开连接的情况,最佳方法是监控主
超级会员免费看
订阅专栏 解锁全文
2924

被折叠的 条评论
为什么被折叠?



