集群有效性测试一般包括停服务、进程挂起、停应用、宕网卡、宕机等测试场景;
现分享停应用测试场景:
测试目的:
考察应用集群节点异常(实例)的情况下,对业务处理的影响。
测试步骤:
1、按照混合测试场景中交易的比例,以被测试系统最大处理能力的50%作为负载压力向被测试系统施压,场景稳定运行10分钟;
2、在应用集群上手工停一台AP的应用实例,场景持续运行10分钟,观察各交易错误率、处理能力、响应时间及各主机资源情况;
3、恢复被停AP的应用实例后,场景持续运行10分钟,观察各交易恢复情况;
4、分析和记录测试结果数据。
预期结果:
1、步骤2后,所有与故障节点相关交易失败,响应时间延长,总TPS值降低,集群其他节点的交易不受影响;1分钟内,其他集群节点接管故障节点的交易处理,交易的响应时间及总处理能力值恢复正常;
2、步骤3后,1分钟内,故障节点能够重新处理交易,交易的响应时间及总处理能力值恢复正常。
监控点:
1、记录切换时间;
2、考察节点的切换时间及业务失败率;
3、查看TPS在回切成功后是否恢复正常值;
4、交易日志;
5、监控系统及各主机CPU利用率、内存占用率、IO繁忙程度等。
测试指标:
1.失效交易处理能力恢复水平(%)为100%;
2.平均失效恢复时间MTTR(秒)小于等于60秒;
3.应用集群机制有效性有效;
4.负载均衡有效性有效。