大数据性能测试怎么做?看完这篇终于懂了

大数据性能测试的目的

1.大数据组件的性能回归,在版本升级的时候,进行新旧版本的性能比对。

2.在新版本/新的生产环境发布之后获取性能基线,建立可度量的参考标准,为其他测试场景或者调优过程提供对比参考。

3.在众多的发行版本中进行测试比对,为PoC测试提供参考数据。

4.支持POC测试,得出结论,到时候可以根据业务模型和需求,或者根据客户需求选择不同的方案。

5.在客户方进行性能测试,达到客户要求的性能标准满足客户使用的需求。

性能测试的时机

上线新版本

上线新的环境/新的主机

开辟了新的区域

PoC 测试

性能专项测试

性能测试的步骤

明确测试的目标

确定性能测试场景,集群规模和规格,数据量,数据格式,压缩算法等。

比如:

版本迭代测试,需要和历史版本集群规格和参数对齐,以便比较版本性能是否劣化;

Poc测试需要明确客户场景;

软件发行商测试,需要与发行商集群规模保持一致。

申请主机环境和测试周期

搭建运行环境和监控

获取的性能指标,部分包含:性能数据,比如带宽、磁盘IO、CPU、内存等指标。

开展测试

测试过程中使用nmon或者其他系统监控的工具记录系统指标变化,以供发现系统瓶颈,利于后续调优。

针对性能结果进行调整优化

进行迭代性能测试。

出具性能测试报告

大数据组件测试工具和方法

在这里插入图片描述

图片

除了上述主流的大数据主键外还有Hbase等,除了主流的测试工具Hibench之外还有雅虎的大数据测试套件。

大数据性能调优

在大数据领域普遍存在数据倾斜的问题,需要参考对应组件的官方文档以及参考业界的案例介绍。

大数据相关的测试

基准测试

单一用户单个事务的测试,目的是在对选择的用户在无压力的情况下获取系统处理单个请求的情况。

负载测试

通过逐步增加系统的负载,测试系统性能的变化。

稳定性测试

通过给系统加载一定的业务压力,运行7*24 小时,以此检测系统是否稳定运行。

功能测试

特别是在OLAP引擎选择的时候,需要测试其对标准SQL支持的情况,如部门不支持update和delete操作、不支持with语句、不支持except和intersection操作等。

性能需求

CPU、内存、磁盘IO、网络负载使用率不超过80%,响应时间90%的读取、写入、导出、导入不超过3s,有不到10%的响应时间不超过5s。

测试案例

1.在不同数据量(100G、500G 、1T)分别对Hadoop和spark进行读取、数据写入、数据导出 数据导入基准测试。

2.在不同数据量下进行并行和读写混合测试。

3.在不同数据量下进行7*24小时的数据稳定性测试。

测试观察指标

  • CPU 使用率

  • 内存使用率

  • IO

  • 网络

  • 响应时间

  • 其他指标

感谢每一个认真阅读我文章的人,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

 

这些资料,对于【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴上万个测试工程师们走过最艰难的路程,希望也能帮助到你!有需要的小伙伴可以点击下方小卡片领取   

 

  • 17
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值