TPC-C是专门针对联机交易处理系统(OLTP系统)的规范,一般情况下我们也把这类系统称为业务处理系统。
tpcc-mysql是percona基于TPC-C(下面简写成TPCC)衍生出来的产品,专用于MySQL基准测试。其源码放在launchpad上,用bazaar管理,项目地址:https://code.launchpad.net/~percona-dev/perconatools/tpcc-mysql
服务器大概配置:
两颗6核12线程CPU,相当于12核24线程
64G内存
1T,SAS 15000转/分钟硬盘
raid5阵列
一、 安装tpcc-mysql工具
安装方法一:
安装bzr客户端
# yum -y install bzr
http://imysql.com/wp-content/uploads/2014/09/tpcc-mysql-src.tgz
之后,就可以开始用bzr客户端下载tpcc-mysql源码了
bzr branch lp:~percona-dev/perconatools/tpcc-mysql
安装方法二:
通过下载源码编译安装(推荐)
MySQL中文网便捷下载地址:
http://imysql.com/wp-content/uploads/2014/09/tpcc-mysql-src.tgz
下载到本地后,先执行 gunzip 解压缩文件,再执行 tar xf 解包,直接 tar zxf 可能会报告异常。
# gunzip tpcc-mysql-src.tgz
# tar xf tpcc-mysql-src.tar
# cd tpcc-mysql/src
# make
# ls
add_fkey_idx.sql count.sql create_table.sql drop_cons.sql load.sh README schema2 scripts src tpcc_load tpcc_start
如果 make 没有报错,就会在 /tmp/tpcc-mysql 下生成 tpcc 二进制命令行工具 tpcc_load 、 tpcc_start
tpcc-mysql的业务逻辑及其相关的几个表作用如下:New-Order:新订单,一次完整的订单事务,几乎涉及到全部表
Payment:支付,主要对应 orders、history 表
Order-Status:订单状态,主要对应 orders、order_line 表
Delivery:发货,主要对应 order_line 表
Stock-Level:库存,主要对应 stock 表
其他相关表:
客户:主要对应 customer 表
地区:主要对应 district 表
商品:主要对应 item 表
仓库:主要对应 warehouse 表
二、TPCC测试前准备
初始化测试库环境
make命令会在tpcc-mysql目录下生成 tpcc 命令行工具 tpcc_load ,tpcc_start
tpcc_load 提供初始化数据的功能
tpcc_start 进行压力测试
# cd /root/tpcc-mysql
# mysqladmin -uroot -pyourpassword create tpcc1000
# 创建测试用的数据库
# mysql -uroot -pyourpassword -f tpcc1000 < create_table.sql# 创建测试用的表
# mysql -uroot -pyourpassword tpcc1000 < add_fkey_idx.sql# 创建FK和索引
初始化完毕后,就可以开始加载测试数据了
tpcc_load使用介绍:
# ./tpcc_load --help
tpcc_load [server] [DB] [user] [pass] [warehouse]
Server:服务器名
DB:数据库名
user:用户名
pass: 密码
Warehouse: 仓库的数量
tpcc_start使用介绍:
#./tpcc_start --help
tpcc_start -h server_host -P port -d database_name -u mysql_user -p mysql_password -w warehouses -c connections -r warmup_time -l running_time -i report_interval -f report_file
介绍一下各个参数的用法
-h server_host: 服务器名
-P port : 端口号,默认为3306
-d database_name: 数据库名
-u mysql_user : 用户名
-p mysql_password : 密码
-w warehouses: 仓库的数量
-c connections : 线程数,默认为1
-r warmup_time : 热身时间,单位:s,默认为10s ,热身是为了将数据加载到内存。
-l running_time: 测试时间,单位:s,默认为20s
-i report_interval: 指定生成报告间隔时长
-f report_file: 测试结果输出文件
选项 warehouse 意为指定测试库下的仓库数量
真实测试场景中,仓库数一般不建议少于100个,视服务器硬件配置而定,如果是配备了SSD或者PCIE SSD这种高IOPS设备的话,建议最少不低于1000个。
执行下面的命令,开始灌入测试数据:
# cd /root/tpcc-mysql
创建150个数据仓库
# ./tpcc_load localhost tpcc1000 root "yourpass" 150
报错
./tpcc_load: error while loading shared libraries: libmysqlclient.so.18: cannot open shared object file: No such file or directory
解决办法:
# echo "/usr/local/mysql/lib" >>/etc/ld.so.conf
# ldconfig
在这里,需要注意的是 tpcc 默认会读取 /var/lib/mysql/mysql.sock 这个socket 文件。
因此,如果你的 socket 文件不在相应路径的话,可以做个软连接,或者通过TCP/IP的方式连接测试服务器,例如:
cd /root/tpcc-mysql
./tpcc_load 1.2.3.4:3306 tpcc1000 tpcc_user "tpcc_password" 10
加载测试数据时长视仓库数量而定,若过程比较久需要稍加耐心等待。
三、进行测试
# ./tpcc_start -hlocalhost -d tpcc1000 -u root -p "yourpassword" -w 150 -c 24 -r 600 -l 7200 - >tpcc-output-log
报错:
neword 0:4
1062, 23000, Duplicate entry '4-3-3020' for key 'PRIMARY'
原来是因为我们改了默认的引擎为MyiSam并且关闭了innodb引擎引起的(生产环境大部分都是myisam的场景,设置了myisam为mysql5.5的默认引擎,而myisam不支持外键所以脚本在创建数据条目的时候不会理会是否主键唯一,这样会造成部分数据主键重复)
default-storage-engine=MyISAM
skip-innodb
即:模拟 150个仓库规模,并发 24个线程进行测试,热身时间为 300秒, 压测时间为 2小时。
真实测试场景中,建议预热时间不小于5分钟,持续压测时长不小于30分钟,否则测试数据可能不具参考意义。
测试结果输出如下(tpcc-output-log文件):
-- 本轮tpcc压测的一些基本信息
***************************************
*** ###easy### TPC-C Load Generator ***
***************************************
option h with value 'localhost' -- 主机
option d with value 'tpcc1000' -- 数据库
option u with value 'root' -- 账号
option p with value 'yourpassword' -- 密码
option w with value '150' -- 仓库数
option c with value '12' -- 并发线程数
option r with value '300' -- 数据预热时长(秒)
option l with value '3600' -- 压测时长(秒)
non-option ARGV-elements: -
[server]: localhost
[port]: 3306
[DBname]: tpcc1000
[user]: root
[pass]: yourpassword
[warehouse]: 150
[connection]: 12
[rampup]: 300 (sec.)
[measure]: 3600 (sec.)
-- 预热结束,开始进行压测
RAMP-UP TIME.(300 sec.)
-- 每10秒钟输出一次压测数据
MEASURING START.
10, 435(0):3.322|6.846, 435(0):0.672|1.661, 44(0):0.386|0.439, 43(0):4.017|4.847, 44(0):11.076|11.907
20, 418(0):3.334|3.482, 416(0):0.669|0.728, 41(0):0.355|0.390, 41(0):3.796|4.356, 41(0):10.580|10.781
30, 410(0):3.332|4.708, 412(0):0.656|1.661, 41(0):0.304|0.308, 42(0):3.844|3.926, 42(0):10.542|10.646
...
3580, 445(0):3.277|3.402, 447(0):0.658|0.765, 44(0):0.326|0.404, 45(0):3.856|3.950, 44(0):10.805|10.899
3590, 388(0):3.352|3.589, 391(0):0.697|0.795, 39(0):0.320|0.330, 39(0):3.826|4.009, 39(0):10.638|10.844
3600, 407(0):3.256|3.390, 405(0):0.676|0.746, 41(0):0.331|0.339, 41(0):3.904|3.910, 41(0):10.625|10.653
-- 以逗号分隔,共6列
-- 第一列,第N次10秒
-- 第二列,新订单成功执行压测的次数(推迟执行压测的次数):90%事务的响应时间|本轮测试最大响应时间,新订单事务数也被认为是总有效事务数的指标
-- 第三列,支付业务成功执行次数(推迟执行次数):90%事务的响应时间|本轮测试最大响应时间
-- 第四列,订单状态业务的结果,后面几个的意义同上
-- 第五列,物流发货业务的结果,后面几个的意义同上
-- 第六列,库存仓储业务的结果,后面几个的意义同上
-- 压测结束
STOPPING THREADS............
-- 第一次结果统计
[0] sc:144136 lt:5 rt:0 fl:0 -- New-Order,新订单业务成功(success,简写sc)次数,延迟(late,简写lt)次数,重试(retry,简写rt)次数,失败(failure,简写fl)次数
[1] sc:144148 lt:0 rt:0 fl:0 -- Payment,支付业务统计,其他同上
[2] sc:14416 lt:0 rt:0 fl:0 -- Order-Status,订单状态业务统计,其他同上
[3] sc:14416 lt:0 rt:0 fl:0 -- Delivery,发货业务统计,其他同上
[4] sc:14416 lt:0 rt:0 fl:0 -- Stock-Level,库存业务统计,其他同上
in 3600 sec.
-- 第二次统计结果,其他同上
[0] sc:144147 lt:5 rt:0 fl:0
[1] sc:144154 lt:0 rt:0 fl:0
[2] sc:14416 lt:0 rt:0 fl:0
[3] sc:14416 lt:0 rt:0 fl:0
[4] sc:14416 lt:0 rt:0 fl:0
(all must be [OK]) -- 下面所有业务逻辑结果都必须为 OK 才行
[transaction percentage]
Payment: 43.48% (>=43.0%) [OK] -- 支付成功次数(上述统计结果中 sc + lt)必须大于43.0%,否则结果为NG,而不是OK
Order-Status: 4.35% (>= 4.0%) [OK] -- 订单状态,其他同上
Delivery: 4.35% (>= 4.0%) [OK] -- 发货,其他同上
Stock-Level: 4.35% (>= 4.0%) [OK] -- 库存,其他同上
[response time (at least 90% passed)] -- 响应耗时指标必须超过90%通过才行
New-Order: 100.00% [OK] -- 下面几个响应耗时指标全部 100% 通过
Payment: 100.00% [OK]
Order-Status: 100.00% [OK]
Delivery: 100.00% [OK]
Stock-Level: 100.00% [OK]
2402.350 TpmC - TpmC结果值(每分钟事务数,该值是第一次统计结果中的新订单事务数除以总耗时分钟数,例如本例中是:144136/60 = 2402.350)
四、生成图表
首先写一个脚本获取数据源:
# vim tpcc-output-analyze.sh
#!/bin/sh
TIMESLOT=1
if [ -n "$2" ]
then
TIMESLOT=$2
fi
cat $1 | grep -v HY000 | grep -v payment | grep -v neword | awk -v timeslot=$TIMESLOT 'BEGIN { FS="[,():]"; s=0; cntr=0; aggr=0 } /MEASURING START/ { s=1} /STOPPING THREADS/ {s=0} /0/ { if (s==1) { cntr++; aggr+=$2; } if ( cntr==timeslot ) { printf ("%d %3d\n",$1,(aggr/timeslot))
; cntr=0; aggr=0 } }'
这个脚本就是对 tpcc-output-log 的第一列与第二列进行运算。
# chmod +x tpcc-output-analyze.sh
#./tpcc-output-analyze.sh tpcc-output-log > tpcc-graphic-data.txt
绘图过程:
#vim log.conf
set terminal gif small size 480,360 #指定输出成gif图片,且图片大小为550×25
set output "tcpp.gif"#指定输出gif图片的文件名
set title "MySQL Performance"#图片标题
set style data lines#显示网格
set xlabel "Time/s"#X轴标题
set ylabel "Data"#Y轴标题
set grid#显示网格
plot \
"tpcc-graphic-data.txt" using 1:2 title "Total throughput" with lines #从tpcc-graphic-data.txt文件中读取第一列和第二列作为X轴和Y轴数据,示例名"Total throughput"
安装绘图工具gnuplot
# yum install -y gnuplot
运行生成tcpp.gif:
# cat log.conf | gnuplot
可以看到在/root/tpcc-mysql目录下已经生成了tcpp.gif图片文件