文章目录
数值类型的常用指标含义
总量误区
误差
模板变量
模板变量的写法
新建模板变量
模板变量的隐藏玩法
grafana 面板编辑器
Metrcis
Legend
Display
高级函数
聚合单个查询的多条匹配曲线的总量 Combine -> sumSeries
时间线迁移 Transform -> timeShift
去除异常值 Filter -> removeAboveValue
重命名函数
多条曲线数值的聚合 Special -> groupByNode
计算多个 Query 组成的成功率 Calculate -> asPercent
其他
报警
statsd 打点的限制
后端查询 grafana 数据
匿名模式
最后
grafana 是一个开源的时序性统计和监控平台,支持例如 elasticsearch、graphite、influxdb 等众多的数据源,并以功能强大的界面编辑器著称。我们在前端监控方面引入 grafana 后取得了一些不错的反馈,但是很多用户由于之前没有接触过 grafana 经常会来询问 grafana 的相关问题,因此希望本文对大家在 grafana 使用方面有所帮助。
grafana 的权限分为三个等级:Viewer、Editor 和 Admin,Viewer 只能查看 grafana 已经存在的面板而不能编辑,Editor 可以编辑面板,Admin 则拥有全部权限例如添加数据源、添加插件、增加 API KEY。
对于普通用户来说,Viewer 权限已经足够,本文接下来的内容主要和 Editor 权限有关。由于篇幅有限,本文作为范例的数据源为 graphite,同时也只介绍最常用的 Graph 图表的配置方法。
数值类型的常用指标含义
count_ps
每秒的数量
count
每十秒的数量
mean_90
去除最高10%的数据后的平均值
upper_90
去除最高10%的数据后的最高值
总量误区
这里有一个常见的 grafana 误区,因为经常有用数值类型的 count_ps 来顺便获取每秒打点数量的情况,注意在这种情况下,一段时间内的打点总量需要使用 count_ps 的 avg 平均值来乘以这段时间的秒数来计算,而不是通过界面上的 Total 直接读取。
这是因为,在界面上一条曲线能够展示的点的数量是有限的,grafana 会根据你的窗口宽度来决定返回的点数,因为像一天这样的时间段肯定没办法在界面上展示每一秒的点,毕竟总量为86400个点就算带鱼屏也不可能挤得下。对于无法展示的点,grafana 默认是使用 avg 平均值的行为来修正返回点的值,举个栗子,如下图:
上图时间范围是一天,上部分为曲线面板的值,下部分为 面饼图表的值,并且上部分图标的曲线为 count 类型(十秒聚一次),可以看到 avg 平均值为 683,那么总量