influxDB聚合类函数

influxDB聚合类函数

1)count()函数

返回一个(field)字段中的非空值的数量。

SELECT COUNT(<field_key>) FROM <measurement_name> [WHERE <stuff>] [GROUP BY <stuff>]
例子1
计算非空water_level数量

SELECT COUNT(water_level) FROM h2o_feet
结果
name: h2o_feet
time count
1970-01-01T00:00:00Z 15258
说明 water_level这个字段在 h2o_feet表中共有15258条数据。


注意:聚合函数中如果没有指定时间的话,会默认以 epoch 0 (1970-01-01T00:00:00Z) 作为时间。

可以在where 中加入时间条件,如下:

例子2

计算非空值water_level每4天时间间隔里的数量

SELECT COUNT(water_level) FROM h2o_feet WHERE time >= '2015-08-18T00:00:00Z' AND time < '2015-09-18T17:00:00Z' GROUP BY time(4d)
结果如下:
name: h2o_feet
--------------
time			 count
2015-08-17T00:00:00Z	 1440
2015-08-21T00:00:00Z	 1920
2015-08-25T00:00:00Z	 1920
2015-08-29T00:00:00Z	 1920
2015-09-02T00:00:00Z	 1915
2015-09-06T00:00:00Z	 1920
2015-09-10T00:00:00Z	 1920
2015-09-14T00:00:00Z	 1920
2015-09-18T00:00:00Z	 335

这样结果中会包含时间结果。

COUNT() and controlling the values reported for intervals with no data(控制时间间隔内没有值的返回值)

其他的InfluxQL功能时函数间间隔内没有值返回null值,count()用0添加:

fill()到查询里,用 . COUNT(),代替null值返回。用0来代替没有值的间隔数,加入fill()来代替0来输出count()数。

Example:用 fill(none) to 去除0的间隔输出数量

COUNT()不用 fill(none):

SELECT COUNT(water_level) FROM h2o_feet WHERE location = ‘santa_monica’ AND time >= ‘2015-09-18T21:41:00Z’ AND time <= ‘2015-09-18T22:41:00Z’ GROUP BY time(30m)
name: h2o_feet
time count
2015-09-18T21:30:00Z 1
2015-09-18T22:00:00Z 0
2015-09-18T22:30:00Z 0
COUNT() 用 fill(none):

SELECT COUNT(water_level) FROM h2o_feet WHERE location = ‘santa_monica’ AND time >= ‘2015-09-18T21:41:00Z’ AND time <= ‘2015-09-18T22:41:00Z’ GROUP BY time(30m) fill(none)
name: h2o_feet
time count
2015-09-18T21:30:00Z 1
For a more general discussion of fill(), see Data Exploration.

2、DISTINCT()函数

返回一个字段(field)的唯一值。
语法:

SELECT DISTINCT(<field_key>) FROM <measurement_name> [WHERE <stuff>] [GROUP BY <stuff>]
例子1
在level description选择唯一的值
SELECT DISTINCT("level description") FROM h2o_feet
结果
name: h2o_feet
--------------
time			  distinct
1970-01-01T00:00:00Z	 between 6 and 9 feet
1970-01-01T00:00:00Z	 below 3 feet
1970-01-01T00:00:00Z	 between 3 and 6 feet
1970-01-01T00:00:00Z	 at or greater than 9 feet

这个例子显示level description这个字段共有四个值,然后将其显示了出来,时间为默认时间。

注:聚合函数返回的时代0(1970-01-01t00:00:00z)为时间戳,除非您指定一个下界的时间范围。然后返回下界作为时间戳。

例子2
选择唯一的值在leve description 以location 标签分组
SELECT DISTINCT("level description") FROM h2o_feet GROUP BY location
结果
name: h2o_feet
tags: location=coyote_creek
time			   distinct
----			   --------
1970-01-01T00:00:00Z	  between 6 and 9 feet
1970-01-01T00:00:00Z	  between 3 and 6 feet
1970-01-01T00:00:00Z	  below 3 feet
1970-01-01T00:00:00Z	  at or greater than 9 feet


name: h2o_feet
tags: location=santa_monica
time			   distinct
----			   --------
1970-01-01T00:00:00Z	  below 3 feet
1970-01-01T00:00:00Z	  between 3 and 6 feet
1970-01-01T00:00:00Z	  between 6 and 9 feet
例子3
聚合函数DISTINCT() 使用count(),以location分组获得level_description的唯一数量
SELECT COUNT(DISTINCT("level description")) FROM h2o_feet GROUP BY location
结果
name: h2o_feet
tags: location = coyote_creek
time			count
----			 -----
1970-01-01T00:00:00Z	 4

name: h2o_feet
tags: location = santa_monica
time			count
----			 -----
1970-01-01T00:00:00Z	 3
 

3)MEAN() 函数

返回一个字段(field)中的值的算术平均值(平均值)。字段类型必须是长整型或float64。

语法格式

SELECT MEAN(<field_key>) FROM <measurement_name> [WHERE <stuff>] [GROUP BY <stuff>]
例子1
计算water_level的平均值
SELECT MEAN(water_level) FROM h2o_feet
结果
name: h2o_feet
--------------
time			  mean
1970-01-01T00:00:00Z	 4.286791371454075
解释:
  说明water_level字段的平均值为4.286791371454075

  时间为默认时间,当然,你也可以加入where条件。

注意:
聚合函数返回的时代0(1970-01-01t00:00:00z)为时间戳,除非您指定一个下界的时间范围。然后他们返回下界的时间戳。
在float64点同一套执行mean()可能会产生稍微不同的结果。
InfluxDB之前不适用的功能,结果在那些小差异排序分。

例子2:
计算wate_level以4天为间隔的平均值
SELECT MEAN(water_level) FROM h2o_feet WHERE time >= '2015-08-18T00:00:00Z' AND time < '2015-09-18T17:00:00Z' GROUP BY time(4d)
结果:
name: h2o_feet
--------------
time			   mean
2015-08-17T00:00:00Z	 4.322029861111125
2015-08-21T00:00:00Z	 4.251395512375667
2015-08-25T00:00:00Z	 4.285036458333324
2015-08-29T00:00:00Z	 4.469495801899061
2015-09-02T00:00:00Z	 4.382785378590083
2015-09-06T00:00:00Z	 4.28849666349042
2015-09-10T00:00:00Z	 4.658127604166656
2015-09-14T00:00:00Z	 4.763504687500006
2015-09-18T00:00:00Z	 4.232829850746268

实战测试:

在这里插入图片描述

要求:对根据设备id(device_id)查询出上述图片中,某个时间段内对应设备在每小时、每分钟的cod、nh3n、total_phosphor的数据。

sql实现:

SELECT MEAN(*) as avg   //用来求平均值
FROM drain_sensor_history_data
where time >= '2023-07-04T00:00:00Z'
AND time <=  '2023-07-05T00:00:00Z'
AND device_id = '136'
GROUP BY time(1m) FILL(0)// time(1m)以每分钟对数据进行聚合time(1h) 以小时聚合数据
order by time ASC

结果:

在这里插入图片描述

4、MEDIAN()函数

从单个字段(field)中的排序值返回中间值(中位数)。中值是在一组数值中居于中间的数值。字段值的类型必须是长整型或float64格式。
语法:

SELECT MEDIAN(<field_key>) FROM <measurement_name> [WHERE ] [GROUP BY ]

注:median()几乎相当于
PERCENTILE(field_key, 50)
,如果参数集合中包含偶数个数字,函数 MEDIAN 将返回位于中间的两个数的平均值。
中值 中值是一组数中间位置的数;即一半数的值比中值大,另一半数的值比中值小。例如,2335710 的中值是 4
例子1
选择water_level的中间值
PERCENTILE(field_key, 50)

SELECT MEDIAN(water_level) from h2o_feet
结果:
name: h2o_feet
--------------
time			 median
1970-01-01T00:00:00Z	 4.124
解释:
说明表中 water_level字段的中位数是 4.124

==注:聚合函数返回的时代0(1970-01-01t00:00:00z)为时间戳,除非您指定一个下界的时间范围。然后返回下界作为时间戳。 ==

例子2:
选择时间在2015818日和81830分,以location分组water_level的中间值
SELECT MEDIAN(water_level) FROM h2o_feet WHERE time >= '2015-08-18T00:00:00Z' AND time < '2015-08-18T00:36:00Z' GROUP BY location
结果:
name: h2o_feet
tags: location = coyote_creek
time			 median
----			 ------
2015-08-18T00:00:00Z	 7.8245

name: h2o_feet
tags: location = santa_monica
time			 median
----			 ------
2015-08-18T00:00:00Z	 2.0575

5)SPREAD()函数

返回字段的最小值和最大值之间的差值。数据的类型必须是长整型或float64。
语法:

SELECT SPREAD(<field_key>) FROM <measurement_name> [WHERE ] [GROUP BY ]

例子1
计算water_level的最小值 与最大值 之间差
SELECT SPREAD(water_level) FROM h2o_feet
结果
name: h2o_feet
--------------
time			 spread
1970-01-01T00:00:00Z	  10.574

注意:
聚合函数返回的时代0(1970-01-01t00:00:00z)为时间戳,除非您指定一个下界的时间范围。然后他们回到下界的时间戳。
在float64点同一套执行spread()可能会产生稍微不同的结果。InfluxDB之前不适用的功能,结果在那些小差异排序分。

例子2
计算water_level的最小值 与最大值差,以30分钟间隔,指定location为
santa_monica,和一个时间范围
SELECT SPREAD(water_level) FROM h2o_feet WHERE location = 'santa_monica' AND time >= '2015-09-18T17:00:00Z' AND time < '2015-09-18T20:30:00Z' GROUP BY time(30m)
结果:
name: h2o_feet
--------------
time			                spread
2015-09-18T17:00:00Z	  0.16699999999999982
2015-09-18T17:30:00Z	  0.5469999999999997
2015-09-18T18:00:00Z	  0.47499999999999964
2015-09-18T18:30:00Z	  0.2560000000000002
2015-09-18T19:00:00Z	  0.23899999999999988
2015-09-18T19:30:00Z	  0.1609999999999996
2015-09-18T20:00:00Z	  0.16800000000000015

6)SUM()函数

返回一个字段中的所有值的和。字段的类型必须是长整型或float64。

语法:

SELECT SUM(<field_key>) FROM <measurement_name> [WHERE <stuff>] [GROUP BY <stuff>]
例子1
计算water_level的所有值的和
SELECT SUM(water_level) FROM h2o_feet
 结果
name: h2o_feet
--------------
time			  sum
1970-01-01T00:00:00Z	 67777.66900000002

注意:
聚合函数返回的时代0(1970-01-01t00:00:00z)为时间戳,除非您指定一个下界的时间范围。然后他们回到下界的时间戳。
在float64点同一套执行sum()可能会产生稍微不同的结果。InfluxDB之前不适用的功能,结果在那些小差异排序分。

例子2 

计算以5天为分组,water_level的和

SELECT SUM(water_level) FROM h2o_feet WHERE time >= '2015-08-18T00:00:00Z' AND time < '2015-09-18T17:00:00Z' GROUP BY time(5d)
结果:
--------------
time			 sum
2015-08-18T00:00:00Z	 10334.908999999983
2015-08-23T00:00:00Z	 10113.356999999995
2015-08-28T00:00:00Z	 10663.683000000006
2015-09-02T00:00:00Z	 10451.321
2015-09-07T00:00:00Z	 10871.817999999994
2015-09-12T00:00:00Z	 11459.00099999999
2015-09-17T00:00:00Z	 3627.762000000003

7)INTEGRAL()函数

8) STDDEV

持续更新中ing

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

三横同学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值