http://junwang.blog.51cto.com/5050337/1430000
RRDtool深入学习
介绍
RRDtool:Round Robin Database Tool(轮询的数据库工具)
是一种存储数据的方式,使用固定大小的空间来存储数据,并有一个指针指向最新的数据的位置。我们可以把用于存储数据的数据库的空间看成一个圆,上面有很多刻度。这些刻度所在的位置就代表用于存储数据的地方。所谓指针,可以认为是从圆心指向这些刻度的一条直线。指针会随着数据的读写自动移动。要注意的是,这个圆没有起点和终点,所以指针可以一直移动,而不用担心到达终点后就无法前进的问题。在一段时间后,当所有的空间都存满了数据,就又从头开始存放。这样整个存储空间的大小就是一个固定的数值。所以RRDtool 就是使用类似的方式来存放数据的工具。
RRDtool的详细使用:
首先,我们需要知道数据库中的数据和我们获取的数据未必是一样的,有可能一样有可能不一样,直接获取的数据对于我们来说没什么意义。我们需要理解数据结构
PDP(Primary Data Point): 主数据点
CDP(Consolidation Data Point): 聚合数据点
解析度(resolution): 指的就是时间跨度
DS(Data Source): 数据源,每一个数据源都可以对其做单独的聚合
RRDtool常用命令
1
2
3
4
5
6
|
rrdtool <create|update|graph|info|fetch>
create: 创建新的RRD数据库文件
update: 更新新的数据到.rrd数据库里面去
graph: 使用存储在.rrd数据库里面的一个或多个RRD生成一个图片
info: 获取一个.rrd的结构信息
fetch: 获取.rrd上数据信息
|
rrdtool create语法介绍
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
rrdtool create filename [--start|-b start
time
] [--step|-s step]
[DS:ds-name:DST:dst arguments]
[RRA:CF:cf arguments]
filename: 默认为.rrd为后辍的文件,名称自己随意取;
--start: 指定RRDtool的第一个记录的起始时间,--start选项的值必须是timestamp的格式。
如查你想自己设定时间可以使用--start $(
date
-d
'1 days ago'
+%s) ,当然还有一种方法就是使用rrdtool fetch filename.rrd AVERAGE;
--step: 就是RRDtool“期望”每隔多长时间就收到一个值;
DS: 用于定义数据源;
ds-name: 指定数据源的名字,随意取。必须是1到19个字符,且是a-z、A-Z、或者0-9;
DST: 定义源数据类型,源数据类型分以下几种:
1、COUNTER 数据必须是递增的,保存的是相对于前面的一个值
2、GUAGE 保存原值
3、DERIVE 可增可减
4、ABSOLUTE 相对于初始值的数值
5、COMPUTE 对于COMPUTE数据源来说格式是DS:ds-name:COMPUTE:rpn-expression
dst argument:数据源参数,形式是: heartbeat:min:max
heartbeat: 定义在我们这个时间跨度之内,再过多长时间过期,过期的标记为unknown;
min: 接收的最小值,一般我们可以都设为0;
max: 接收的最大值,如果不是很清楚其最大值可以设置为U;
RRA: 用于指定数据如何存放;
CF: 指定数据合并方法,合并方法分以下几种:
1、average 平均值
2、max 最大值
3、min 最小值
4、last 当前值
cf arguments:数据保存,它的形式是: xff:steps:rows
xff: 定义PDP中出现unknown的百分比高于设置的这个比例以后CDP也被标记为unknown;
steps: 聚合函数对多少个pdp做聚合生成cdp;
rows: 保存多少个聚合的cdp结果;
|
rrdtool update语法介绍
1
2
3
4
5
6
|
rrdtool {update | updatev} filename [--template | -t ds-name[:ds-name]...]
[--] N | timestamp:value[:value...]
-t : 改变接收数据的次序
例如,我们定义的rrdtool create
test
.rrd DS:ds1 DS:ds2,默认情况下我们想这个数据库里面输入值得话是:rrdtool update
test
.rrd N:30(DS1值):40(DS2值),
使用rrdtool update
test
.rrd -t ds2:ds1 40:30 把循序给颠倒;
N: 表示当前时间
|
rrdtool info语法介绍
1
|
rrdtool info filename 用于查看filename的数据结构(filename就是rrdtool create生成的数据库文件);
|
rrdtool fetch语法介绍
1
2
3
|
rrdtool fetch filename [-r
#] [CF]
-r
#: 指定#个PDP为一个数据;
CF: 指定使用哪种合并函数,与rrdtool create中cf argument一样;
|
rrdtool graph语法介绍
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
|
rrdtool graph|graphv filename [option ...][datadefinition ...][data calculation ...][variabledefinition ...][graph element ...][print element ...]
[-s|--start
time
][-e|--end
time
][-S|--step seconds]
[-t|--title string][-V |--Vertical-label string ]
[-w|--width pixels][-h|--height pixels][-j|--only-graph][-D|--full-size-mode]
OPTION:
Graph Limits
[-u | --upper-limit value]: 显示数值的最大上限的值
[-l | --lower-limit value]: 显示的最低下限的值
[-r | --rigid ]: 不会自动缩放,以定义的最大值和最小值来显示
[-A | --alt-autoscale ]: 启用自动缩放,但是最大的和最小的是不能超过上面的范围
[-J | --alt-autoscale-min]: 只自动缩放最小值
[-M | --alt-autoscale-max ]: 只自动缩放最大值
[-N | --no-gridfit]: 不显示网格线
定义横轴:
X-Axis
[-x|--x-grid GTM:GST(定义基准网格线,前面是单位,后面是数值)
:MTM:MST(定义主网格线,前面的是单位,后面的是数值)
:LTM:LST(定义横轴底面的标签的单位和距离,前面是单位,后面是距离)
:LPR:LFM(显示标签的显示格式)]
[-x | --x-grid none ]
Y-Axis
[-y|--y-grid grid(刻度是什么) step(多长显示一个刻度)
:label(卷标显示是什么) factor(卷标多长时间显示一个)]:
[-y|--y-grid none ]
[-Y| --alt-y-grid]
图片全局定义
[-c| --color COLORTAGE
#rrggbb[aa]]
BACK
#背景色
CANVAS
#画布颜色
SHADEA
#左边和上边的颜色
SHADEB
#右边和下边的颜色
GRID,MGRID
#主网格线的颜色
FONT
#字体颜色
AXIS
#坐标轴的颜色
FRAME
#边框颜色
ARROW
#箭头的颜色
-n | --font FONTTAG(字体名字):size(大小):[font(路径)]
#指定字体的参数
[-R|--font-render-mode(字体格式) {normal(正常),light(发亮),mono(粗体)}]
[-a|--imgformat PNG|SVG|EPS|PDF]
#图像输出格式
[-W| --watermark string ]
#加水印
数据与变量
定义数据获取方式:
DEF:vname(变量名,只能包含数字和字母,最长不能超过255字符)=rrdfile(rrd文件路径):ds-name(数据源名称):CF(聚合函数)[:step=step][:start=
time
][:end=
time
]
CDEF:vname=RPN expression
VDEF:vname=RPN expression
图片
线状图:
LINE[width(线条的粗细程度,1最细的3是最粗的)
:value(上面定义的变量名称)[
#color(线条颜色)]
[:[legend(底面的标签名称)][:STACK]]
[:dashes[=on_s[,off_s[,on_s,off_s]...]
[:dash-offset=offset]
面积图:
AREA:value[
#color][:[legend][:STACK]]
|
实例1:随机生成数据
1、创建一个hello.rrd数据库文件
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
|
# rrdtool create test.rrd --step 5 DS:testds:GAUGE:8:0:U RRA:AVERAGE:0.5:1:17280 RRA:AVERAGE:0.5:10:3456 RRA:AVERAGE:0.5:100:1210
# rrdtool info test.rrd
filename =
"test.rrd"
rrd_version =
"0003"
step = 5
last_update = 1403544501
ds[testds].
type
=
"GAUGE"
ds[testds].minimal_heartbeat = 8
ds[testds].min = 0.0000000000e+00
ds[testds].max = NaN
ds[testds].last_ds =
"U"
ds[testds].value = 0.0000000000e+00
ds[testds].unknown_sec = 1
rra[0].cf =
"AVERAGE"
rra[0].rows = 17280
rra[0].cur_row = 5294
rra[0].pdp_per_row = 1
rra[0].xff = 5.0000000000e-01
rra[0].cdp_prep[0].value = NaN
rra[0].cdp_prep[0].unknown_datapoints = 0
rra[1].cf =
"AVERAGE"
rra[1].rows = 3456
rra[1].cur_row = 1634
rra[1].pdp_per_row = 10
rra[1].xff = 5.0000000000e-01
rra[1].cdp_prep[0].value = NaN
rra[1].cdp_prep[0].unknown_datapoints = 0
rra[2].cf =
"AVERAGE"
rra[2].rows = 1210
rra[2].cur_row = 622
rra[2].pdp_per_row = 100
rra[2].xff = 5.0000000000e-01
rra[2].cdp_prep[0].value = NaN
rra[2].cdp_prep[0].unknown_datapoints = 0
|
2、写一个脚本random.sh,它能自动给hello.rrd中写入数据
1
2
3
4
5
6
7
|
# vim random.sh
#!/bin/bash
while
true
;
do
rrdtool update test1.rrd N:$RANDOM
sleep
5
done
# bash -x random.sh
|
3、一段时间后,我们可以查看hello.rrd中的数据
1
2
3
4
5
6
7
|
# rrdtool fetch test.rrd AVERAGE -r 5 //这里我们使用每5s的解析度来显示,如果我们使用每10s呢?因为test.rrd中没有定义每10s的解析度,所以它自动会选择小于自定义的,且最靠近的解析度值显示
... ... ... ... ... ......
1403544585: -nan
1403544590: 2.0996768708e+03
1403544595: 1.6197283451e+04
1403544600: 1.1111383278e+04
1403544605: -nan
|
4、画图
1)单线条画法:
1
2
|
# rrdtool graph test1.png --step 5 -s 1403544590 -t TEST -v vtest DEF:vtest=test.rrd:testds:AVERAGE LINE1:vtest#FF0000:testline1
497x174
|
把文件复制到windows主机上查看一下吧:
2)多线条画法:
1
2
|
# rrdtool graph test2.png -s 1403544590 -t TEST -v vtest DEF:vtest1=test.rrd:testds:AVERAGE:step=5 DEF:vtest2=test.rrd:testds:AVERAGE:step=50 LINE1:vtest1#FF0000:testline1 LINE1:vtest2#00FF00:testline2
497x174
|
实例2:这里我们来记录mysql用户查询次数
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
# rrdtool create mysql.rrd --step 3 DS:myselect:COUNTER:5:0:U RRA:AVERAGE:0.5:1:28800 RRA:AVERAGE:0.5:10:2880 RRA:MAX:0.5:10:2880 RRA:LAST:0.5:10:2880
# vim mysql_select.sh
#!/bin/bash
while
true
;
do
select
=`mysql -e
"show global status like 'com_select'"
|
awk
'/Com_select/{print $2}'
`
rrdtool update mysql.rrd N:$
select
sleep
3
done
#由于数据产生太慢,我们再写一个脚本来增大数据量,实验效果更加明显:
# mysql
mysql> create database testdb;
mysql> use testdb;
mysql> create table tb1(
id
int not null auto_increment primary key,name varchar(50) not null);
mysql> quit
# vim insert.sh
#!/bin/bash
for
i
in
{1..20000};
do
mysql -e
"insert into testdb.tb1 (name) values(user$i)"
mysql -e
"select * from testdb.tb1"
&>
/dev/null
done
# bash -x mysql_select.sh
# bash -x insert.sh
# rrdtool graph mysql1.png -s 1403547726 -t "mysql select" -v "select per" DEF:select3=mysql.rrd:myselect:AVERAGE:step=3 LINE1:select3#FF0000:"每3秒值"
497x174
|
我们再扩展一下:
1
2
|
多条线组合在一张图片上:
# rrdtool graph mysql1.png -s 1403547726 -t "mysql select" -v "select per" DEF:select3=mysql.rrd:myselect:AVERAGE:step=3 DEF:select30=mysql.rrd:myselect:AVERAGE:step=30 LINE1:select3#FF0000:"每3秒值" LINE1:select30#00FF00:"每30秒值"
|
1
2
|
为指定的线注明最大值
# rrdtool graph mysql1.png -s 1403547726 -t "mysql select" -v "select per 3/s" DEF:select30=mysql.rrd:myselect:AVERAGE:step=30 DEF:max30=mysql.rrd:myselect:MAX:step=30 LINE1:select30#FF0000:"每30秒取值" GPRINT:max30:MAX:"最大值\:%6.2lf"
|