本节书摘来自异步社区《全栈性能测试修炼宝典 JMeter实战》一书中的第1章,第1.6节性能测试技能树,作者ROAD_TESTING软件测试组 组稿 , 陈志勇 , 马利伟 , 万龙,更多章节内容可以访问云栖社区“异步社区”公众号查看。
1.6 性能测试技能树
下面细化一下性能测试所要掌握的知识,如图1-1所示。
1.6.1 测试工具
通过测试工具能提高测试软件开发速度,腾出时间专注于问题分析。主流工具有LoadRunner与JMeter,当然了,工具也不能解决所有问题,有时候还是需要自己编写程序来实现测试脚本。很多初学者认为这2个工具只能用来做性能测试,其实能做性能测试的工具也可以做功能自动化回归、API和UI测试等都可以实现。不是非得Selinum、WebDriver等才能做自动化测试。
常见难点
(1)用户和业务模型分析搭建;
(2)合适的脚本开发(大部分初学者不根据用户和业务模型来开发脚本,认为要回归成功即可);
(3)合适的需求分析转化为场景设计(大部分初学者不知道如何根据需求进行场景设计);
(4)大容量系统的数据生成和使用;
(5)大型系统的性能压力负载和实施;
(6)云计算的负载生成和实施。
1.6.2 测试基础
性能测试是一门富有挑战的、有深度的、综合性的学科。
很多性能测试初学者总觉得性能测试就是写个脚本,弄几台机器压一压,出个报告就行了。通常关注“并发多少”“响应时间多少”“能跑通吗”这些问题。认为并发越大,响应时间越快,那性能一定就越好。
性能测试不仅仅是录制脚本或者编写程序,基本的性能理论、性能执行的原则还是要了解的。同样的脚本,不同的人员执行,不同的针对点,测试结果会大相径庭。
实际上我们需要对系统进行一系列复杂的需求分析,以及一系列性能测试计划和设计的工作才能开始性能测试执行。经过N次回归,找到瓶颈的具体原因,并优化。掌握性能理论基础才能驾驭那些性能测试工具等,没有掌握性能理论基础直接操作好比开车找不到目标,盲目原地打转或离目标越来越远。
自动化测试的目的是为了提高工作效率,目前,功能测试与性能测试都朝着这个方向发展,这些都是持续集成的一分子。
鉴于目前行业内普遍项目时间紧,性能测试架构师在公司担任性能测试、自动化测试等多种角色,那么减少加班和追求高效益和高成就是我们全栈性能测试工作者的追求了。
有时候测试工具并不能够解决测试脚本问题,比如现在流行的SOA架构封装的RPC协议,就需要写代码来解决脚本问题。业内比较有名的比如Dubbo、Dubbox,笔者也碰到过这一类的测试,鉴于工作的重复性,为了节省时间提高效率,ROAD_TESTING 团队在为某企业团队性能测试内训时对JMeter进行二次开发测试元件(如图1-2所示),专门用来测试Dubbo、Dubbox协议的接口,这样我们功能测试人员都可以直接选择测试的项目与接口就可以、直接无脚本编程来做性能测试执行,大大提高了脚本开发效率。
常见难点
(1)评估需求;
(2)负载建模(用户与业务模型);
(3)性能压力生成的原理和并发等之间的关系;
(4)性能测试用例;
(5)新系统需求分析;
(6)容量规划;
(7)性能测试策略。
1.6.3 代码
作为IT部门的一员不可避免地要和开发代码打交道,了解编程知识既能提高测试内涵,还能提高交流沟通的效果。更重要的是,做自动化测试、单元测试、性能测试、安全测试都离不开代码。所以我们还是要掌握一些普及率高的编程语言和脚本语言。这里我们推荐Java、Python等。
Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,目前也是国内公司使用的相对普及的语言。
Python具有丰富和强大的库。它常被称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++ )很轻松地联结在一起。Python是目前国内测试行业比较热门的一门语言,很容易上手,也可以搜索公共库的代码来缩减自己写代码的工作量和时间。
1.6.4 服务器性能诊断知识
不管我们的程序如何高大上,不管我们用什么语言实现,最终还是要依赖服务器硬件,依赖数字信号,依赖模拟电路。服务器硬件是性能之本,所有性能都会反映到硬件指标上来,我们想要分析性能,服务器知识少不得。服务器几大件,如CPU、存储、内存、网络的性能指标,监控方法都需要熟练掌握。管理这些硬件的操作系统的原理,性能配置参数也需要掌握。要掌握这部分需要学习很多运维和开发知识。
了解操作系统及其内核对于系统分析是至关重要的。作为性能测试工程师来说我们需要进行对系统行为做分析:系统调用是如何执行的、CPU是如何调度线程、有限大小的内存是如何影响性能的,或者是文件系统是如何处理I/O的,这些都是我们判断系统瓶颈的依据和线索。
1.Linux
Linux是一套免费使用和自由传播的类UNIX操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了UNIX以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。越多越多的企业用这个系统作为服务器的操作系统,所以作为性能测试从业者来说,是必须掌握的系统之一,搭建环境、性能诊断是离不开它的。
目前Linux/UNIX的分支很多,普及率比较多的有CENTOS 、Ubuntu、RedHAT、Red Hat HP-UX、AIX、Solaris等。
2.Windows Server
Windows Server是Microsoft Windows Server System(WSS)的核心,是服务器操作系统。目前使用比较多的都是中小型公司,目前2008和2012版本相对比较多。
数据库是我们系统存储处理的最重要的手段,很大一部分性能问题都牵扯到数据库。所以我们需要深入地了解掌握数据库的语言SQL,以及常规的性能诊断和调优手法。
数据库目前有很多,关系型的如DB2、Oracle、SQLServer、MySQL等,更有非关系型临时性键值存储(memcached、Redis)、永久性键值存储(ROMA、Redis)、面向文档的数据库(MongoDB、CouchDB)、面向列的数据库(Cassandra、HBase)Hadoop等。
3.Oracle
Oracle Database,简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的适应高吞吐量的数据库解决方案。
4.MySQL
MySQL是Oracle收购的一个轻量型开源数据库,越来越多的公司为应对日益增长的数据库规模,在原有的基础上二次开发分布式数据库,也是目前国内比较流行的数据库。很多大型公司也在MySQL的基础上进行了分布式的开发,MySQL的能力被大大增强。
5.NoSQL数据库
NoSQL,泛指非关系型的数据库。随着互联网Web 2.0网站的兴起,应对超大规模和高并发的网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。NoSQL有很多种类型,我们来一起了解。
(1)键值数据库—Redis
支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,它提供多种语言的API。其特点是每次存储一个数据时,是根据Key进行索引存储的。Redis适用于数据变化快且数据库大小可预见的应用程序,股票、数据分析、实时数据搜集、通信等。7月阿里云宣布推出了自己的Redis云数据库KVStore for Redis,应用于游戏、电商、社交等行业。
(2)列存储数据库—Cassandra
最初由Facebook开发,于2008年转成开源项目。它是混合型的非关系数据库,在网络社交云计算方面应用较理想,读操作比写操作快很多,较适用于银行、金融、数据分析等领域。
(3)文档型数据库-MongoDB 、CouchDB
文档型数据库的灵感来自于Lotus Notes办公软件,而且它同第一种键值存储类似。该类型的数据模型是版本化的文档,半结构化的文档以特定的格式存储,如JSON。文档型数据库可以看作是键值数据库的升级版,允许之间嵌套键值。而且文档型数据库比键值数据库的查询效率更高。
图形结构的数据库同其他行列以及刚性结构的SQL数据库不同,它是使用灵活的图形模型,并且能够扩展到多个服务器上。许多NoSQL数据库都有REST式的数据接口或者查询API,如Neo4J、InfoGrid、Infinite Graph。
常见难点
(1)进程、线程任务之间的区别?
(2)线程的中断优先和原理?
(3)进程的生命周期?
(4)上下文切换?
(5)I/O密集型和CPU密集型工作负载之间有什么区别?
(6)生产环境和测试环境之间换算?
(7)关系型数据库体系结构和逻辑优化与非关系型数据库体系结构和逻辑优化?
(8)事务数据库和分析数据库的使用?
(9)数据关系建模与设计?
(10)TOP N SQL诊断和优化(执行路径、索引和表链接优化等)?
(11)阻击和根治阻塞和死锁?
(12)热点防范和定位优化?
(13)业务数据批量缓存化异步化?
(14)数据库配置优化?
1.6.5 性能调优技能
面对一个性能不佳且复杂的系统,我们做的是建立性能数据分析模型、收集相关资源和指标信息、分析这些数据背后可能的原因。很多人说性能测试最难的就是定位性能瓶颈,笔者赞同这种看法。这需要扎实的全栈IT技术基础和业务敏感度以及解决经验。
另外性能优化是一个系统工程,内容涉及系统各方面,从上到下有软件产品(项目)、中间件、虚拟机、操作系统、硬件。软件产品有系统架构、业务设计、代码实现、数据库物理设计及数据库各种配置等。所以想要做好性能调优,不仅仅是一个人的事,而是整个项目团队的事。
对于测试来说,不管是脚本实现,还是测试过程中的网络监测,都需要针对通信协议;常见的HTTP/HTTPS、Socket/WebSocket、WebService(Soap)等协议运用广泛,自然要熟悉。
具体请看后面性能优化章节。
常见难点
(1)系统硬件资源(CPU、网络、内存、IO)相互之间的关系及原理;
(2)选择可靠性能指标及指标之间的关联和判定方法;
(3)永不宕机的实现原理和常见错误;
(4)排队系统与延迟及缓存的优化关系;
(5)优化的成本和性价比;
(6)业务优化的操作实施;
(7)多系统串联原理及测试隔离。
1.6.6 自动化/持续集成
当下流行的持续集成工具有Jenkins、Git/SVN、Maven、Ant等
利用Jekins、Hudson等持续集成工具将我们性能测试搭建环境、执行等时间大幅缩短,无效率工作重复次数也大幅降低。持续集成可以帮助我们自动化代码集成、环境集成、自动测试执行和储存和整理测试报告。
1.6.7 云计算及虚拟化
通常基于虚拟化技术,允许一个用户或多个用户共享一个物理服务器。虽然给我们中小企业带来很多的便利,但这会引起资源的竞争以及性能测试的难度。架构的不确定性、其他网络等硬件资源的成本限制、云上性能负载机的额外开销等。部分云服务商提供新型云服务收费性能测试工具,我们可以在本地开发测试完毕后,再部署到云上。