-
FROM
查询数据来源一个或者多个measurement
。 -
WHERE
查询条件可为tag keys
和time
,field keys
也可作为查询条件但是不常用,因为不是索引,查询效率比较低。tag keys
条件操作符支持=、!=、<>、正则
,field keys
支持=、!=、<>、>、>=、<、<=、正则
。 -
GROUP BY
只能对tag keys
和time
进行合分组,可以多字段排序,如group by tag1,tag2,time
,也可一个*
对所有的tag
进行分组聚合(不包括time
)。 -
ORDER BY
只能对time
进行排序,asc
升序,desc
降序。 -
LIMIT
分页,LIMIT
后面的数字是查询显示多少条,OFFSET
后面数字代表偏移量(从0开始代表第一条),如limit 10 offset 10
意思为从第11条开始往后10条。
现在开始简单查询之前导入的示例数据:
(1)查询average_temperature的数据。
因为数据量比较大,配合limit防止返回大量数据。
select * from average_temperature limit 2
(2)查询average_temperature
,location
为coyote_creek
的数据,字段只显示time
和degrees
。
select time, degrees from average_temperature where location=‘coyote_creek’ limit 2
上面的数据显示格式是column,且时间是时间戳,前面的文章也介绍过,可执行如下指令进行设置:
输入json格式
format json
让json格式输出更好看
pretty
格式化时间显示
precision rfc3339
where
后面没有in
来范围查询,但是有or
也可以做到异曲同工之妙。
select * from h2o_pH where location=‘coyote_creek’ or location=‘santa_monica’ limit 4
tag keys
和field keys
都支持正则,可通过如下正则达到模糊查询的效果。
location名称中包含coyote的数据
select * from h2o_quality where location=~/.coyote./ limit 10
(1)group by tag
对location
分组查询,返回结果是一个大results
对象结果集内包含两个series
,第一个series
是location
为coyote_creek
的聚合结果集,第二个series
是location
为santa_monica
的聚合结果集。
select * from h2o_pH group by location limit 2
查询结果显示
{
“results”: [
{
“series”: [
{
“name”: “h2o_pH”,
“tags”: {
“location”: “coyote_creek”
},
“columns”: [
“time”,
“pH”
],
“values”: [
[
“2019-08-17T00:00:00Z”,
7
],
[
“2019-08-17T00:06:00Z”,
8
]
]
}
]
},
{
“series”: [
{
“name”: “h2o_pH”,
“tags”: {
“location”: “santa_monica”
},
“columns”: [
“time”,
“pH”
],
“values”: [
[
“2019-08-17T00:00:00Z”,
6
],
[
“2019-08-17T00:06:00Z”,
6
]
]
}
]
}
]
}
(2)group by time(1m)
对time
分组时并不是简单的group by time
,time
后面还需要加一个分组聚合的持续时间,如group by time(1m)
。支持的持续时间单位有:
| 单位 | 备注 |
| — | — |
| u or µ | microseconds (1 millionth of a second) |
| ms | milliseconds (1 thousandth of a second) |
| s | second |
| m | minute |
| h | hour |
| d | day |
| w | week |
对time
进行分组,查询结果必须对field
使用聚合函数,如count()
、sum()
、max()
、min()
等。
select sum(pH) from h2o_pH group by time(1m) limit 4
查询结果显示
{
“results”: [
{
“series”: [
{
“name”: “h2o_pH”,
“columns”: [
“time”,
“sum”
],
“values”: [
[
“2019-08-17T08:00:00+08:00”,
13
],
[
“2019-08-17T08:01:00+08:00”,
null
]
]
}
]
}
]
}
由于Influxdb
时区默认是UTC
,若以一天进行数据聚合,需要加上便宜量 -8h 进行聚合:
select sum(pH) from h2o_pH group by time(1d,-8h) fill(0) limit 4
(3)fill(0)填充null
可以看到values
结果集中有null
的情况,可在查询语句中加fill(0)
,遇到null
用0
来填充。fill()
中只能填数字。
order by
只能对time
进行排序,asc
升序,desc
降序。
select sum(pH) from h2o_pH group by time(1m) fill(0) order by time asc limit 2
limit
可单独使用,也可配合offset
使用,offset
偏移量的意思。
select sum(pH) from h2o_pH group by time(1h) fill(0) order by time asc limit 2 offset 10
select
进行多个tag
分组后,会返回多个series
,可使用slmit
限制series
返回的个数。slimit
不像limit
有偏移量offset
,但是可以配合limit
一起使用:
查询显示 前两个series,且每个series里显示2条数据,偏移量10
select * from h2o_quality group by * limit 2 offset 10 slimit 2
多表查询,以时间进行连接,不存在的值用null填充。一般情况连接的两张表tag和field上有一定的联系和比较,毫不相干的两表连接查询没什么价值。
select * from h2o_feet,h2o_pH limit 1
{
“results”: [
{
“series”: [
总结
我们总是喜欢瞻仰大厂的大神们,但实际上大神也不过凡人,与菜鸟程序员相比,也就多花了几分心思,如果你再不努力,差距也只会越来越大。
面试题多多少少对于你接下来所要做的事肯定有点帮助,但我更希望你能透过面试题去总结自己的不足,以提高自己核心技术竞争力。每一次面试经历都是对你技术的扫盲,面试后的复盘总结效果是极好的!
多表查询,以时间进行连接,不存在的值用null填充。一般情况连接的两张表tag和field上有一定的联系和比较,毫不相干的两表连接查询没什么价值。
select * from h2o_feet,h2o_pH limit 1
{
“results”: [
{
“series”: [
总结
我们总是喜欢瞻仰大厂的大神们,但实际上大神也不过凡人,与菜鸟程序员相比,也就多花了几分心思,如果你再不努力,差距也只会越来越大。
面试题多多少少对于你接下来所要做的事肯定有点帮助,但我更希望你能透过面试题去总结自己的不足,以提高自己核心技术竞争力。每一次面试经历都是对你技术的扫盲,面试后的复盘总结效果是极好的!
[外链图片转存中…(img-9t10Vfvp-1714300617555)]