大数据性能测试介绍

大数据性能测试的目的

1.大数据组件的性能回归,在版本升级的时候,进行新旧版本的性能比对

2.在新版本/新的生产环境 发布之后获取性能基线,建立可度量的参考标准,为其他测试场景或者调优过程提供对比参考

3.在众多的发行版本中进行测试比对,为PoC测试提供参考数据

4.支持POC测试,得出结论,到时候可以根据业务模型和需求,或者根据客户需求 选择不同的方案

5.在客户方进行性能测试,达到客户要求的性能标准满足客户使用的需求。

性能测试的时机

1.上线新版本

2.上线新的环境/新的主机

3.开辟了新的区域

4.PoC 测试

5.性能专项测试

性能测试的步骤

1.明确测试的目标

确定性能测试场景,集群规模和规格,数据量,数据格式,压缩算法等。比如版本迭代测试,需要和历史版本集群规格和参数对齐,以便比较版本性能是否劣化;Poc测试需要明确客户场景;软件发行商测试,需要与发行商集群规模保持一致。

2.申请主机环境和测试周期

3.搭建运行环境和监控

获取的性能指标 部分包含:性能数据,比如带宽,磁盘IO,CPU,内存等指标

4.开展测试 测试过程中使用nmon或者其他系统监控的工具记录系统指标变化,以供发现系统瓶颈,利于后续调优。

5.针对性能结果进行调整优化,进行迭代性能测试

6.出具性能测试报告

大数据组件测试工具和方法
在这里插入图片描述
在这里插入图片描述
除了上述主流的大数据主键外还有Hbase等

除了主流的测试工具 Hibench 之外还有雅虎的大数据测试套件

https://github.com/Intel-bigdata/HiBenchhttps://github.com/elastic/rallyhttps://github.com/yahoo/streaming-benchmarkshttps://github.com/brianfrankcooper/YCSB

大数据性能调优

1.在大数据领域普遍存在数据倾斜的问题,需要参考对应组件的官方文档

2.参考业界的案例介绍

大数据相关的测试

基准测试 单一用户单个事务的测试,目的是在对选择的用户在无压力的情况下获取系统处理单个请求的情况

负载测试 通过逐步增加系统的负载,测试系统性能的变化

稳定性测试 通过给系统加载一定的业务压力,运行7*24 小时,以此检测系统是否稳定运行。

功能测试 特别是在OLAP引擎选择的时候,需要测试其对标准SQL支持的情况,如部门不支持update和delete操作, 不支持with语句,不支持except和intersection操作等

性能需求 CPU,内存,磁盘IO,网络负载使用率不超过80% 响应时间 90%的 读取 写入 导出 导入 不超过 3s,有不到10%的响应时间不超过 5s

测试案例 1.在不同数据量 (100G 500G 1T) 分别对Hadoop和spark 进行读取,数据写入,数据导出 数据导入基准测试

2.在不同数据量下进行并行 和读写混合测试

3.在不同数据量下进行 7 * 24小时的数据稳定性测试

测试观察指标

1.CPU 使用率
2.内存使用率
3.IO
4.网络
5.响应时间
6.其他指标

最后感谢每一个认真阅读我文章的人,下面这个网盘链接也是我费了几天时间整理的非常全面的,希望也能帮助到有需要的你!

在这里插入图片描述

这些资料,对于想转行做【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴我走过了最艰难的路程,希望也能帮助到你!凡事要趁早,特别是技术行业,一定要提升技术功底。希望对大家有所帮助……

如果你不想一个人野蛮生长,找不到系统的资料,问题得不到帮助,坚持几天便放弃的感受的话,可以点击下方小卡片加入我们群,大家可以一起讨论交流,里面会有各种软件测试资料和技术交流。

点击文末小卡片领取

敲字不易,如果此文章对你有帮助的话,点个赞收个藏来个关注,给作者一个鼓励。也方便你下次能够快速查找。

自学推荐B站视频:

零基础转行软件测试:自学完软件测试,拿到了字节的测试岗offer,堪称B站最好的视频!

自动化测试进阶:已上岸华为,涨薪20K,2022最适合自学的python自动化测试教程,自己花16800买的,无偿分享

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
进行大数据性能测试需要考虑以下几个方面: 1. 测试环境:需要确保测试环境和生产环境一致,包括硬件配置、操作系统、软件版本等。测试环境应该具备足够的计资源和存储资源,以满足测试数据的存储和计需求。 2. 测试数据:需要使用真实的数据进行测试,以确保测试结果具有可信度。测试数据应该具有多样性和复杂性,包括不同类型的数据、不同大小的数据文件、不同的数据格式等。 3. 测试工具:需要选择适合大数据性能测试的工具,如Apache JMeter、Gatling、Locust等。这些工具可以模拟大量并发用户对系统的请求,以评估系统的性能和可靠性。 4. 测试场景:需要根据实际使用情况,设计不同的测试场景,例如读取数据、写入数据、查询数据、分析数据等。每个场景都应该包括不同的参数设置,以反映真实的使用情况。 5. 测试指标:需要定义合适的性能指标,例如响应时间、吞吐量、并发数、CPU使用率、内存使用率等。这些指标可以帮助评估系统的性能和可靠性,并提供性能优化的参考依据。 6. 测试报告:需要生成详细的测试报告,包括测试结果、性能指标、测试日志、错误日志等。测试报告应该能够清晰地表达测试结果,并提供性能优化的建议。 总之,进行大数据性能测试需要综合考虑多个因素,包括测试环境、测试数据、测试工具、测试场景、测试指标和测试报告等。通过科学合理地设计和执行测试,可以评估系统的性能和可靠性,并提供性能优化的参考依据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

代码小怡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值