【达梦数据库】数据库测试


前言

数据库测试是依据数据库设计规范对软件系统的数据库结构、数据表及其之间的数据调用关系进行的测试。本文主要介绍了两项常用的测试基准 TPC-C 和 TPC-H ,并通过达梦数据库 DM8 分别进行了数据库测试。


1 数据库测试

1.1 测试流程

制定测试大纲,编写测试用例,测试执行,形成测试报告。

1.2 测试内容

功能、性能、可靠性、安全性、易用性、维护性、可扩展性、兼容性。

1.3 测试标准

针对数据库不同的使用场景 TPC 组织发布了多项测试标准。其中被业界广泛接受和使用的有 TPC-C 、TPC-H 和 TPC-DS。

TPC-C、TPC-H 和 TPC-DS 三者最大的一个区别是,TPC-C 是针对 OLTP 数据库进行性能测试,而 TPC-H 和 TPC-DS 是针对 OLAP 数据库进行测试的。本文主要讲解和实践 TPC-C 和 TPC-H 基准测试。


2 TPC-C基准测试

2.1 概念介绍

TPC(transaction processing performance council)被称为事务处理性能委员会,负责定义诸如 TPC-C、TPC-H & TPC-R 和 TPC-W 基准测试之类的事务处理与数据库性能基准测试,并依据这些基准测试项目发布客观性能数据。

TPC-C 是衡量联机事务处理(OLTP,Online Transaction Processing)系统的工业标准,是行业中公认的权威和最为复杂的在线事务处理基准测试。它通过模拟仓库和订单管理系统,测试广泛的数据库功能,包括查询、更新和 mini-batch 事务(队列式小批量事务)。TPC-C基准测试针对一种模拟订单录入与销售环境测量每分钟商业事务(tpmC)吞吐量。

2.2 模型介绍

TPC-C 测试用到的模型是一个大型的商品批发销售公司,它拥有若干个分布在不同区域的商品仓库。每个仓库负责为10个销售点供货,其中每个销售点为3000个客户提供服务,每个客户提交的订单中,平均每个订单有10项产品(5-15件),所有订单中约1%的产品在其直接所属的仓库中没有存货,必须由其他区域的仓库来供货。同时,每个仓库都要维护公司销售的100000种商品的库存记录。

在这里插入图片描述

表名意义数量级
C_ITEM商品种类:固定值100K
C_WAREHOUSE仓库数W
C_STOCK库存数=仓库数*商品种类W*100K
C_DISTRICT分区数=仓库数*10W*10
C_CUSTOMER客户数=分区数*3000W*30K
C_ORDER订单数=客户数W*30K+
C_HISTORY历史订单数=客户数W*30K+
C_NEW_ORDER新订单数=订单数*900/3000W*9K+
C_ORDER_LINE订单行数=订单数100.99…W*300K+
事务类型混合的最小百分比最小按键时间第90个百分比响应时间约束最小平均时间分布思考
新订单n/a18 秒5 秒12 秒
支付433 秒5 秒12 秒
订单状态42 秒5 秒10 秒
发货42 秒5 秒5 秒
库存级别42 秒20 秒5 秒
  • TPC-C 有 9 张表和 5 种事务。
  • TPC-C 最大的有效的吞吐量(MQTh)的度量是每分钟处理的新订单数量,单位是 tpmC 。
  • MQTh 正常的范围为(active-warehouse*terminals-per-warehouse)的0.9倍至1.2倍之间。
  • 为了得到较高的 MQTh ,可以根据实际测试结果预估,来调整 Active-warehouse 再次测试。

2.3 测试流程

(1) 初始化数据库
(2) 建表、装载数据
(3) 扩库及日志和创建索引
(4) 数据冷备份
(5) 性能调优
(6) 配置TPCC工具进行测试

2.4 工具介绍

BenchmarkSQL 是一款经典的开源数据库测试工具,其包含 TPCC 测试脚本,应用范围广泛。支持达梦数据库、MySQL、Oracle、EnterpriseDB、PostgreSQL 以及 SQL Server 等数据库的性能压力测试。

BenchmarkSQL 是基于 Java 语言开发的,可以跨平台运行。在安装压测工具之前,必须先安装 JDK(要求 JDK1.7 及以上)并且配置 JAVA 环境变量。

BenchmarkSQL 是非标准TPC-C模型,纯压力测试

2.5 操作步骤

(1) 执行SQL工具建表

./runSQL.sh props.pg sqlTableCreates

(2) 执行数据装载工具装载数据

./runLoader.sh props.pg numWarehouses 100

(3) 执行测试工具

./runBenchmark.sh props.pg

(4) 为提高性能,通常采用后台运行的方式

nohup ./runBenchmark.sh props.pg > /dev/null 2>&1 &

(5) 测试报告打印在run/log文件下

Benchmarksql.log

2.6 测试结果的验证方式

(1) TPCC基准测试一致性验证语句

(Select w_id, w_ytd from warehouse) except (select d_w_id, sum(d_ytd) from district group by d_w_id); 
(Select d_w_id, d_id, D_NEXT_O_ID - 1 from district) except (select o_w_id, o_d_id, max(o_id) from oorder group by o_w_id, o_d_id);
(Select d_w_id, d_id, D_NEXT_O_ID - 1 from district) except (select no_w_id, no_d_id, max(no_o_id) from new_order group by no_w_id, no_d_id);
select * from (select (count(no_o_id)-(max(no_o_id)-min(no_o_id)+1)) as diff from new_order group by no_w_id, no_d_id) where diff != 0;
(select o_w_id, o_d_id, sum(o_ol_cnt) from oorder  group by o_w_id, o_d_id) except (select ol_w_id, ol_d_id, count(ol_o_id) from order_line group by ol_w_id, ol_d_id);
(select d_w_id, sum(d_ytd) from district group by d_w_id) except (Select w_id, w_ytd from warehouse);

连接到数据库做以上查询,如果结果全为0行,则说明tpcc库是一致的,否则说明此库在运行过程中数据出现混乱。

(2) 验证 bmsql_history 表新增的记录数
transaction count * 43% 约等于 bmsql_history 表增加的数据量,不能存在数量级的偏差。


3 TPC-H基准测试

3.1 概念介绍

TPC-H 是一个决策支持的基准,它由一系列面向商务应用的查询和并行数据修改组成。基准里选择的查询和组成数据库的数据在商业上都具有广泛的代表性并且易于实现。主要针对OLAP数据库进行测试的。
TPC-H 数据库由八个单独的表(基本表)组成和22个查询语句。
TPCH 标准包含执行功能测试和吞吐率测试。

3.2 模型介绍

TPC-H是一款面向商品零售业的决策支持系统测试基准,它定义了 8 张表,22 个查询,遵循 SQL92;
请添加图片描述

在这里插入图片描述

表名行数
SUPPLIERSF*10000
PARTSF*200000
PARTSUPPSF*800000
CUSTOMERSF*150000
ORDERSSF*1500000
LINEITEMSF*6000000
NATION25
REGION5

3.3 测试流程

(1)使用 dbgen 工具生成数据
(2)使用 dmfldr 工具 加载数据
(3)通过 Q22 查询验证


4 TPCC测试实战

利用 TPCC 测试工具 BENCHMARKSQL,测试单机 10 warehouse 的性能。

环境准备:

  • 操作系统:CentOS 7
  • 服务器配置:2核 4G
  • 磁盘容量:20G
  • 数据库版本:dm8_20220304_x86_rh6_64
  • BenchmarkSQL 工具版本:benchmarksql-5.0rc2-westone-v1.2
  • JAVA 版本:JDK 1.8

具体步骤:

(1) 切换为 root,在 opt 目录下创建 tpcc 文件夹,移动安装包到 /opt/tpcc 并解压,添加 dmdba:dinstall 权限,得到如下文件。

在这里插入图片描述

(2) 进入 run 文件夹,查看 props.dm 文件。

在这里插入图片描述

(3) 修改配置。

在这里插入图片描述

需要关注的参数:

  • user:工具写死了必须用benchmarksql模式,所以user必须为benchmarksql用户。
  • warehouses:被测仓库数。
  • loadworkers:数据装载并发数。
  • terminals:数据库连接并发数。
  • runMins:测试时间(分钟)。

(4) 在DM管理工具里创建表空间、用户和表。

在这里插入图片描述

(5) 查看表中数据量,均为0。

在这里插入图片描述

(6) 执行./runLoader.sh 装载数据。

在这里插入图片描述
在这里插入图片描述

偶尔因为网络原因导致加载仓库顺序有变化,属于正常现象。

(7) 查看当前数据量。

在这里插入图片描述

(8) 创建序列。

在这里插入图片描述

(9) 执行测试工具。

在这里插入图片描述
在这里插入图片描述

225.23÷496.42≈45.37% ,与 43%相比偏高了。

结果参数说明:

  • Running Average tpmTOTAL:每分钟平均执行事务数(所有事务)
  • Memory Usage:客户端内存使用情况
  • Measured tpmC (NewOrders) :每分钟执行的事务数(只统计 NewOrders 事务)
  • Transaction Count:执行的交易总数量

(10) 执行TPCC基准测试一致性验证语句,结果都为空。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

(11) 验证 bmsql_history 表新增的记录数。

在这里插入图片描述

transaction count * 43% 约等于 bmsql_history 表增加的数据量。


5 TPCH测试实战

利用TPCH测试工具简单进行1G规模测试 。

具体步骤:

(1) 使用dbgen生成数据。

在这里插入图片描述

(2) 在数据库中创建表结构。

在这里插入图片描述

(3) 利用 degen 工具模拟生成1G的数据。会在当前目录下生成数据源文件,用来之后 dmfldr 导入的元数据。

在这里插入图片描述

在这里插入图片描述

(4) 返回 linux 目录,修改每个表的 dmfldr 控制文件。

在这里插入图片描述

主要是修改两个路径,如下图所示。

在这里插入图片描述

(5) 使用 dmfldr 工具加载数据。( dmfldr 的路径在 /dm/dmdba/dmdbms/bin )
依次执行:

./dmfldr userid=SYSDBA/SYSDBA:5236 control=\'/opt/tpch/linux/customer.ctrl\'
./dmfldr userid=SYSDBA/SYSDBA:5236 control=\'/opt/tpch/linux/lineitem.ctrl\'
./dmfldr userid=SYSDBA/SYSDBA:5236 control=\'/opt/tpch/linux/nation.ctrl\'
./dmfldr userid=SYSDBA/SYSDBA:5236 control=\'/opt/tpch/linux/orders.ctrl\'
./dmfldr userid=SYSDBA/SYSDBA:5236 control=\'/opt/tpch/linux/part.ctrl\'
./dmfldr userid=SYSDBA/SYSDBA:5236 control=\'/opt/tpch/linux/partsupp.ctrl\'
./dmfldr userid=SYSDBA/SYSDBA:5236 control=\'/opt/tpch/linux/region.ctrl\'
./dmfldr userid=SYSDBA/SYSDBA:5236 control=\'/opt/tpch/linux/supplier.ctrl\'

在这里插入图片描述
在这里插入图片描述

(此处只列举了一个 customer 的导入进程。)

(6) 更新统计信息。

在这里插入图片描述

(7) 通过 Q22 查询验证。(此处为Q20)

在这里插入图片描述


总结

本文介绍了数据库测试中的 TPCC 和 TPCH 两项测试基准,并完成实践 DM8 数据库测试。

如果文中有误,欢迎指出,大家共同交流进步!

更多达梦技术资讯,请访问达梦技术社区:
达梦数据库 - 新一代大型通用关系型数据库 | 达梦云适配中心
https://eco.dameng.com/

  • 2
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
LoadRunner是一款功能强大的自动化性能测试工具,可用于进行数据库测试数据库测试是对数据库系统进行负载和压力测试,以评估其性能和稳定性。 首先,LoadRunner通过模拟并发用户访问数据库,可以测试数据库的性能和响应时间。我们可以创建不同的脚本来模拟真实的用户行为,例如插入、更新、删除和查询数据等,从而模拟真实的负载情况。 其次,LoadRunner可以测量数据库服务器的吞吐量和并发连接数。通过逐渐增加并发用户的数量,我们可以确定数据库在不同负载情况下的表现。同时,LoadRunner还可以衡量数据库服务器的响应时间,以评估其性能是否满足需求。 此外,LoadRunner还提供了丰富的监控和分析功能,可以监视数据库服务器的关键性能指标,如CPU利用率、内存使用情况和磁盘IO等。这些指标可以帮助我们找出性能瓶颈,并优化数据库系统的配置。 最后,LoadRunner可以生成详细的测试报告,包括数据库的性能指标、错误率以及响应时间等。这些报告可以用于评估数据库的性能,并为优化数据库系统提供指导。 总之,LoadRunner是一个非常强大的工具,可以用于进行数据库测试。通过模拟真实的用户行为,衡量数据库的性能指标,并提供丰富的监控和分析功能,LoadRunner可以帮助我们评估数据库系统的性能和稳定性,并提供优化建议。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值