软件工程导论11-软件测试

软件测试

1.内容概述(???)

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

2.软件测试基础

2.1.有关软件测试的错误观点

  1. “软件测试是为了证明程序是正确的,即测试能发现程序中所有的错误”。(x)

    事实上这是不可能的。要通过测试发现程序中的所有错误,就要穷举所有可能的输入数据。

    例如:(1) 对于一个输入三个16位字长的整型数据的程序,输入数据的所有组合情况有2**48 ,如果测试一个数据需1ms,则即使一年365天一天24小时不停地测试,也需要约1万年。

    (2)对一个具有多重选择和循环嵌套的程序,不同的路径数目可能是天文数字。例如一个小程序的流程图,它包括了一个执行20次的循环,其循环体有五个分支。这个循环的不同执行路径数达5**20条,如果对每一条路径进行测试需要1毫秒,那么即使一年工作365 × 24小时,要想把所有路径测试完,大约需3170年。

  2. “程序测试是证明程序正确地执行了预期的功能”。(x)

    实际上,一个程序不仅要完成它所需完成的功能,而且不应完成它不该做的事。

    例:三条边相等的三角形是等边三角形。

    如不能把边长为0、0、0的三条边判断为等边三角形。

2.2.软件测试的目的

Glen Myers给出的软件测试目的:

  • 测试是一个为了发现错误而执行程序的过程
  • 一个好的测试用例是指很可能找到迄今为至尚未发现的错误的测试用例
  • 一个成功的测试是指揭示了迄今为至尚未发现的错误的测试

根据这个测试目的,我们应该排除对测试的错误观点,设计合适的测试用例,用尽可能少的测试用例,来发现尽可能多的软件错误。

2.3.软件测试的基本原则

Davis提出了一组指导软件测试的基本原则

  1. 所有的测试都应可追溯到客户需求
  2. 应该在测试工作真正开始前的较长时间就进行测试计划
  3. Pareto原则:测试中发现的80%的错误可能来自于20%的程序代码
  4. 测试应从“小规模”开始,逐步转向“大规模”
  5. 穷举测试是不可能的
  6. 为了达到最有效的测试,应由独立的第三方来承担测试

其他的测试原则:

  1. 在设计测试用例时,应包括合理的输入条件和不合理的输入条件
  2. 严格执行测试计划,排除测试的随意性
  3. 应当对每一个测试结果做全面检查
  4. 妥善保存测试计划、测试用例、出错统计和最终分析报告,为维护提供方便
  5. 检查程序是否做了应做的事,仅仅是成功的一半,而成功的另一半是检查程序是否做了不该做的事
  6. 在规划测试时不要设想程序中不会查出错误
2.3.1.测试用例
  • 测试用例的设计是软件测试的关键所在
  • 设计尽可能少的测试用例来发现尽可能多的错误
  • 设计最有可能发现软件错误的测试用例,同时避免使用发现错误效果相同的测试用例
  • 测试用例的设计方法大体可分为两类:白盒测试和黑盒测试,也称白箱测试和黑箱测试

2.4.白盒测试和黑盒测试

  • 白盒测试(又称为结构测试)把测试对象看作一个透明的盒子,测试人员根据程序内部的逻辑结构有关信息设计测试用例,检查程序中所有逻辑路径是否都按预定的要求正确地工作。(对照设计)

  • 白盒测试主要用于对模块的测试,包括:

    • 程序模块中的所有独立路径至少执行一次
    • 对所有逻辑判定的取值(“真”与“假”)都至少测试一次
    • 在上下边界及可操作范围内运行所有循环
    • 测试内部数据结构的有效性等
  • 黑盒测试(又称行为测试)把测试对象看做一个黑盒子,测试人员完全不考虑程序内部的逻辑结构内部特性,只依据程序的需求规格说明书,检查程序的功能是否符合它的功能需求。(对照需求)

  • 黑盒测试可用于各种测试,它试图发现以下类型的错误:

    • 不正确或遗漏的功能
    • 接口错误,如输入/输出参数的个数、类型等
    • 数据结构错误或外部信息(如外部数据库)访问错误
    • 性能错误
    • 初始化和中止错误

3.白盒测试

常用的百盒测试方法有:

  • 逻辑覆盖测试
  • 基本路径覆盖测试
  • 数据流测试
  • 循环测试

3.1.逻辑覆盖测试

定义:逻辑覆盖主要考察使用测试数据运行被测程序时程序逻辑的覆盖程度。通常希望选择最少的测试用例来满足所需的覆盖标准

主要的覆盖标准有:

  • 语句覆盖
  • 判定覆盖
  • 条件覆盖
  • 判定-条件覆盖
  • 条件组合覆盖
  • 路径覆盖
3.1.1.逻辑表达式错误敏感的测试
  • 逻辑覆盖测试依赖于程序中的逻辑条件,这些逻辑条件由逻辑表达式组成。对于一个含有n个逻辑变量,或n个关系表达式的逻辑表达式,通常需要2^n个测试用例来覆盖其所有可能的条件组合。
  • 当n较大时,我们可以选择对发现逻辑表达式错误比较敏感的组合条件进行测试,以较少的测试用例来发现逻辑表达式中的绝大多数错误。

3.2.基本路径测试

  • 基本路径测试是Tom McCabe提出的一种白盒测试技术
    • 首先根据程序或设计图画出控制流图,并计算其区域数
    • 然后确定一组独立的程序执行路径(称为基本路径)
    • 最后为每一条基本路径设计一个测试用例。

3.3.循环测试

  • 循环分为4种不同类型:简单循环、嵌套循环、串接循环、非结构循环

    在这里插入图片描述

3.3.1.简单循环

按照下列规则设计测试用例:

  1. 零次循环:从循环入口到出口
  2. 一次循环:检查循环初始值
  3. 二次循环:检查多次循环
  4. m次循环: 检查多次循环
  5. 比最大次数少一次的循环
  6. 最大次数循环
  7. 比最大次数多一次的循环
3.3.2.嵌套循环

按照下列规则设计测试用例:

  1. 先测试最内层循环:所有外层的循环变量置为最小值,最内层按简单循环测试;
  2. 由里向外,测试上一层循环:测试时此层以外的所有外层循环的循环变量取最小值,此层以内的所有嵌套内层循环的循环变量取“典型”值,该层按简单循环测试;
  3. 重复上一条规则,直到所有各层循环测试完毕;
  4. 对全部各层循环同时取最小循环次数,同时取最大循环次数
3.3.3.串接循环

如果串接的各个循环互相独立,则可以分别用简单循环的方法进行测试;但如果第一个循环的循环变量与第二个循环控制相关,则两个循环不独立,此时,把第一个循环看作外循环,第二个循环看作内循环,然后用测试嵌套循环的办法来处理。

3.3.4.非结构循环

这一类循环应该先将其结构化,然后再测试

4.黑盒测试

  • 黑盒测试是依据软件的需求规约,检查程序的功能是否符合需求规约的要求。
  • 主要的黑盒测试方法有:
    • 等价类划分
    • 边界值分析
    • 比较测试
    • 错误猜测
    • 因果图

4.1.等价类划分

  • 由于不能穷举所有可能的输入数据来进行测试,所以只能选择少量有代表性的输入数据,来揭露尽可能多的程序错误
  • 等价类划分方法将所有可能的输入数据划分成若干个等价类,然后在每个等价类中选取一个代表性的数据作为测试用例
  1. 等价类划分方法把输入数据分为有效输入数据无效输入数据
  2. 有效输入数据指符合规格说明要求的合理的输入数据,主要用来检验程序是否实现了规格说明中的功能
  3. 无效输入数据指不符合规格说明要求的不合理或非法的输入数据,主要用来检验程序是否做了规格说明以外的事
  4. 在确定输入数据等价类时,常常还要分析输出数据的等价类,以便根据输出数据等价类导出输入数据等价类
4.1.1.等价类划分设计测试用例的步骤
  1. 确定等价类

    根据软件的规格说明,对每一个输入条件(通常是规格说明中的一句话或一个短语)确定若干个有效等价类和若干个无效等价类。

    可使用如下表格:

    输入条件有效等价类无效等价类
  2. 确定等价类的规则:

    如果输入条件规定了取值范围,则可以确定一个有效等价类(输入值在此范围内)和两个无效等价类(输入值小于最小值及大于最大值)

  3. 设计测试用例

    在确定了等价类之后,建立等价类表,列出所有划分出的等价类。并为每个有效等价类和无效等价类编号。

4.2.边界值分析

边界值分析也是一种黑盒测试方法,是对等价类划分方法的补充

人们从长期的测试工作经验得知,大量的错误是发生在输入或输出范围的边界上,而不是在输入范围的内部。因此针对各种边界情况设计测试用例,其揭露程序中错误的可能性就更大。

边界值分析方法选择测试用例的规则如下:

  1. 如果输入条件规定了值的范围,则选择刚刚达到这个范围的边界的值以及刚刚超出这个范围的边界的值作为测试输入数据。
  2. 如果输入条件规定了值的个数,则分别选择最大个数、最小个数、比最大个数多1、比最小个数少1的数据作为测试输入数据。
  3. 对每个输出条件使用第1条。
  4. 对每个输出条件使用第2条。
  5. 如果程序的输入或输出是个有序集合,例如,顺序文件、表格,则应把注意力集中在有序集的第1个元素和最后一个元素上。
  6. 如果程序中定义的内部数据结构有预定义的边界,则应选择使得正好达到该数据结构边界以及刚好超出该数据结构边界的输入数据作为测试数据。
  7. 发挥你的智慧,找出其他可能的边界条件。

4.3.比较测试

  • 在现实中,有些软件有很高的可靠性要求,特别是那些可能危及人的生命安全的软件系统,如航空航天控制软件、核电厂控制软件等,其软件可靠性绝对重要。此时,需要冗余的硬件和软件来减少错误发生的可能性。
  • 通常,可由二支软件开发队伍,根据相同的需求规格说明分别开发二个软件版本,然后,用相同的测试用例对二个版本的软件分别进行测试,比较二个版本软件的测试结果,如果测试结果相同,则可认为二个版本的软件都是正确的,如果测试结果不同,则要分析各个版本,以发现错误的所在。这种测试称为比较测试或称为背靠背测试(back―to―back testing)。大多数情况下,可用自动化工具来进行比较测试
  • 值得注意的是,比较测试并不能保证软件没有错误,如果规格说明本身有错,那么所有的版本都可能反映这种错误。
  • 另外,如果各个版本产生相同的,但都不正确的结果,那么比较测试也无法发现这种错误。

4.4.错误猜测

  • 错误猜测是一种凭直觉和经验推测某些可能存在的错误,从而针对这些可能存在的错误设计测试用例的方法。
  • 这种方法没有机械的执行步骤,主要依靠直觉和经验。
  • 错误猜测法的基本思想是:列举出程序中所有可能的错误和容易发生错误的特殊情况,然后根据这些猜测设计测试用例

(姐系靠估)

5.测试策略

  • 一种测试策略就是将测试分为单元测试、集成测试、确认测试和系统测试
  • 单元测试是针对程序中的模块或构件,主要揭露编码阶段产生的错误。
  • 集成测试针对集成的软件系统,主要揭露设计阶段产生的错误。
  • 确认测试是根据软件需求规约对集成的软件进行确认,主要揭露不符合需求规约的错误。
  • 对于基于计算机系统中的软件,还需将它集成到基于计算机系统中,并进行系统测试,以揭露不符合系统工程中对软件要求的错误。

V模型:描述软件开发各阶段与测试策略之间的对应关系。

在这里插入图片描述

(原来V模型在这- -)

Tom Gilb指出实现一个成功的软件测试策略必须涉及的问题:

  1. 在着手开始测试之前的较长时间,就要以量化的形式确定产品的需求。
  2. 显式地陈述测试目标。
  3. 了解软件的用户并为每一类用户建立剖面(profile)图
  4. 建立一个强调“快速循环(rapid cycle)测试”的测试计划。
  5. 构造“健壮”的软件,它被设计成可测试自身。
  6. 使用有效的正式技术评审,作为测试之前的过滤器。
  7. 使用正式技术评审,来评估测试策略和测试用例本身。
  8. 为测试过程建立一种持续改进的方法。

5.1.单元测试(Unit Testing)

  • 单元测试又称模块测试,它着重对软件设计的**最小单元(软件构件或模块)**进行验证
  • 单元测试根据设计描述,对重要的控制路径进行测试,以发现构件或模块内部的错误
  • 单元测试通常采用白盒测试,并且多个构件或模块可以并行进行测试
  • 这里将构件或模块统一称为模块
5.1.1.单元测试的内容
  1. 模块接口:确保模块的输入/输出参数信息是正确的。这些信息包括参数的个数、次序、类型等。
  2. 局部数据结构:确保临时存储的数据在算法执行的整个过程中都能维持其完整性。如不合适的类型说明、不同数据类型的比较或赋值、文件打开和关闭的遗漏、超越数据结构的边界等。
  3. 边界条件:确保程序单元在极限或严格的情况下仍能正确地执行。
  4. 所有独立路径:确保模块中的所有语句都至少执行一次。程序执行的路径实际上体现了计算的过程,计算中常见的错误有:不正确的操作优先级、不同类型数据间的操作、不正确的初始化、不精确的精度、不正确的循环中止、不适当地修改循环变量、发散的迭代等。
  5. 所有错误处理路径:单元测试应该对所有的错误处理路径进行测试。错误处理部分潜在的错误有:报错信息没有提供足够的信息来帮助确定错误的性质及其发生的位置、报错信息与真正的错误不一致、错误条件在错误处理之前就已引起系统异常、异常条件处理不正确等。

5.2.集成测试(Integrated Testing)

集成测试 也称组装测试、联合测试

经单元测试后,每个模块都能独立工作,但把它们放在一起往往不能正常工作。

主要问题在于:

  1. 数据可能在通过接口时丢失;
  2. 一个模块可能对另一个模块产生非故意的、有害的影响(即副作用);
  3. 当子功能被组合起来时,可能不能达到期望的主功能;
  4. 单个模块可以接受的不精确性(如误差),连接起来后可能会扩大到无法接受的程度;
  5. 全局数据结构可能会存在问题。

集成方式有两种

  • 非增量式集成:使用“一步到位”的方法来构造程序。先将所有经过单元测试的模块组合在一起,然后对整个程序(作为一个整体)进行测试。这种测试在发现错误时,很难为错误定位。改正错误时容易引入新的错误,新旧错误混在一起,更难定位。(一起来测)
  • 增量式集成:根据程序结构图,按某种次序挑选一个(或一组)尚未测试过的模块,把它集成到已测试好的模块中一起进行测试,每次增加一个(或一组)模块,直至所有模块全部集成到程序中。在增量集成测试过程中发现的错误,往往与新加入的模块有关。

增量式集成又可分为自顶向下集成自底向上集成

5.3.回归测试(Regression Testing)

  • 在集成测试过程中,每当增加一个(或一组)新模块时,原先已集成的软件就发生了改变。新的数据流路径被建立,新的I/O操作可能出现,还可能激活新的控制逻辑,这些改变可能使原本正常的功能产生错误。
  • 当测试时发现错误后,需修改程序;或者在软件维护时也需修改程序。这些对程序的修改也可能使原本正常的功能产生错误。
  • 回归测试就是对已经进行过的测试的子集的重新执行,以确保对程序的改变和修改,没有传播非故意的副作用。

回归测试集(已经过测试的子集)包括三种不同类型的测试用例:

  • 能测试软件所有功能的代表性测试用例
  • 专门针对可能会被修改影响的软件功能的附加测试
  • 注重于修改过的软件模块的测试

5.4.确认测试(Validation Testing)

5.4.1.确认测试标准
  • 确认测试以软件需求规约为依据,以发现软件与需求不一致的错误。
  • 主要检查软件是否实现了规约规定的全部功能要求,文档资料是否完整、正确、合理,其他的需求,如可移植性、可维护性、兼容性、错误恢复能力等是否满足。

确认测试的结果可分为两类:

  • 满足需求规约要求的功能或性能特性,用户可以接受。
  • 发现与需求规约有偏差,此时需列出问题清单。
5.4.2.软件配置评审

软件配置评审也称软件审计(audit),其目的是保证软件配置的所有成分都齐全,各方面的质量都符合要求,具有维护阶段必需的细节,而且已经编排好分类目录。

软件配置主要包括计算机程序(源代码和可执行程序)针对开发者和用户的各类文档包含在程序内部或程序外部的数据

5.4.3.α测试和β测试
  • 如果软件是为一个客户开发的,那么,最后由客户进行验收测试(acceptance test),以使客户确认该软件是他所需要的。
  • 如果软件是给许多客户使用的(如市场上销售的各种软件),那么让每个客户做验收测试是不现实的。大多数软件厂商都使用一种称为α测试β测试的过程,来发现那些似乎只有最终用户才能发现的错误。
  • α测试由一个用户在开发者的场所进行的,软件在开发者的“指导下”进行测试。经α测试后的软件称为α版软件。
  • β测试是由软件的最终用户在一个或多个用户场所进行的,与α测试不同,开发者通常不在测试现场,因此,β测试是软件在一个开发者不能控制的环境中的“活的”应用,用户记录所有在β测试中遇到的(真正的或想象的)问题,并定期把这些问题报告给开发者,在接到β测试的问题报告后,开发者对软件进行最后的修改,然后着手准备向所有的用户发布最终的软件产品。(这不就是内测吗)

5.5.系统测试(System Testing)

  • 系统测试是对整个基于计算机的系统进行的一系列测试。
  • 系统测试的种类很多,每种测试都有不同的目的,它们从不同的角度测试计算机系统是否被正常地集成,并完成相应的功能。
  • 常用的系统测试包括:
    • 恢复测试(recovery testing)
    • 安全测试(security testing)
    • 压力测试(stress testing)
    • 性能测试(performance testing)
5.5.1.恢复测试(recovery testing)
  • 恢复测试是通过各种手段,强制软件发生故障,然后来验证系统能否在指定的时间间隔内恢复正常,包括修正错误并重新启动系统
  • 如果恢复是由系统自身来完成的,那么,需验证重新初始化、检查点机制、数据恢复和重启动等的正确性。
  • 如果恢复需要人工干预,那么要估算平均修复时间**MTTR(mean time to repair)**是否在用户可以接受的范围内。
5.5.2.安全测试(security testing)
  • 安全测试用来验证集成在系统中的保护机制能否实际保护系统不受非法侵入。
  • 在安全测试过程中,测试者扮演一个试图攻击系统的角色,采用各种方式攻击系统。例如,截取或码译密码;借助特殊软件攻击系统;“制服”系统,使他人无法访问;故意导致系统失效,企图在系统恢复之机侵入系统;通过浏览非保密数据,从中找出进入系统的钥匙等等。
  • 一般来说,只要有足够的时间和资源,好的完全测试一定能最终侵入系统。系统设计者的任务是把系统设计成:攻破系统所付出的代价大于攻破系统后得到信息的价值。
5.5.3.压力测试(stress testing)

压力测试也称强度测试,它是在一种需要非正常数量、频率或容量的方式下执行系统,其目的是检查系统对非正常情况的承受程度。

例如:

  • 当系统的中断频率是每秒1或2个时,执行每秒10个中断的测试用例
  • 将输入数据的数量提高一个数量级来测试输入功能如何响应
  • 执行需要最大内存或其它资源的测试用例
  • 执行可能导致大量磁盘驻留数据的测试用例
5.5.4.性能测试(performance testing)

性能测试用来测试软件在集成的系统中的运行性能。它对实时系统和嵌入式系统尤为重要。

性能测试可以发生在测试过程的所有步骤中

  • 单元测试时,主要测试一个独立模块的性能,如算法的执行速度。
  • 软件集成后,进行软件整体的性能测试。
  • 计算机系统集成后,进行整个计算机系统的性能测试。

性能测试常常需要与压力测试结合起来进行,而且常常需要一些硬件和软件测试设备,以监测系统的运行情况。

6.面向对象测试

面向对象软件的测试目标仍然是用最少时间和工作量来发现尽可能多的错误

但面向对象软件的性质改变了测试的策略测试战术面向对象软件的测试也给软件工程师带来新的挑战。

6.1.面向对象语境对测试的影响

继承、封装、多态性、基于消息的通信等概念都是面向对象软件的重要特征,它们对面向对象测试有很大的影响。

6.1.1.单元

适用于面向对象测试的两种单元定义

  • 单元是可以编译和执行的最小软件部件
  • 单元是决不会指派给多个设计人员开发的软件部件

是面向对象软件中的单元

6.1.2.封装

由于属性和操作被封装在类中,因此测试时很难获得对象的某些具体信息(除非提供内置操作来报告这些信息),从而给测试带来困难。

6.1.3.继承

测试了父类的操作后,并不表示其子类就不必对继承的操作进行测试。

6.1.4.多态性

在测试时,应覆盖反映多态的所有实现方法。

6.1.5.基于消息的通信

面向对象软件是通过消息通信来实现类之间的协作,它们没有明显的层次控制结构,因此,传统的自顶向下和自底向上集成策略不适用于面向对象软件测试。

6.2.面向对象的测试策略

把类作为面向对象软件的单元,传统的单元测试等价于面向对象中的类测试,也称类内测试。它包括类内的方法测试类的行为测试

面向对象中的类间测试(interclass testing)相当于面向对象的集成测试。它有两种集成策略:

  • 基于线程的测试(thread-based testing):集成一组互相协作的类来响应系统的一个输入或事件,每个线程逐一被集成和测试,并通过回归测试保证其没有产生副作用。
  • 基于使用的测试(use-based testing):按使用层次来集成系统。把那些几乎不使用其他类提供的服务的类称为独立类把使用类的类称为依赖类。集成从测试独立类开始,然后集成直接依赖于独立类的那些类,并对其测试。按照依赖的层次关系,逐层集成并测试,直至所有的类被集成。

7.测试完成标准

因为无法判定当前查出的错误是否是最后一个错误,所以决定什么时候停止程序测试就成了最困难的问题,但是测试最后一定要停止的。

几种实用的测试完成标准:

​ Musa和Ackerman提出了一个基于统计标准的答复:“不,我们不能绝对地认定软件永远也不会再出错,但是相对于一个理论上合理的和在试验中有效的统计模型来说,如果一个在按照概率的方法定义的环境中,1000个CPU小时内不出错运行的概率大于0.995的话,那么我们就有95%的信心说,我们已经进行了足够的测试”。

标准:

  1. 使用指定的测试用例设计方法产生测试用例,运行这些测试用例均未发现错误(包括发现错误后已被纠正的情况),则测试可终止。
  2. 观察测试阶段中单位时间内发现错误数目的曲线:

在这里插入图片描述

8.调试

测试的目的是发现错误,调式(也称排错)的目的是确定错误的原因和准确位置,并加以纠正

8.1.调式过程

在这里插入图片描述

8.2.调式方法

8.2.1.蛮力法
  • 蛮力法是一种最省脑筋但又最低效的方法。它通过在程序中设置断点,输出寄存器、存储器的内容,打印有关变量的值等手段,获取大量现场信息,从中找出错误的原因。
  • 这种方法效率低,输出的信息大多是无用的,通常在其他调试方法未能找到错误原因时,才使用这种方法。
  • 可以采用二分法来逐步缩小出错的范围。
8.2.2.回溯法

回溯法是从错误的征兆出发,人工沿着控制流程往回跟踪,直至发现错误的根源。这种方法适用于小型程序,对大型程序,由于回溯的路径太多,难以彻底回溯。

8.2.3.原因排除法

原因排除法又可分为归纳法演绎法

归纳法:是一种从特殊推断一般的系统化思考方法。其基本思想是:从一些线索(错误征兆)着手,通过分析它们之间的关系来找出错误的原因。

在这里插入图片描述

演绎法:演绎法从一般原理或前提出发,假设所有可能出错的原因,排除不可能正确的假设,最后推导出结论。

在这里插入图片描述

8.3.纠正错误

修改一个错误常常会引入新的错误。

在为纠正某个错误而修改程序之前应该回答三个问题:

  • 在程序的其他地方是否也存在同类的错误?
  • 本次修改可能会引发什么新的错误?
  • 为了防止这个错误,我们应该做什么?
  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值