一、类别变量(模板使用)
- {“find”: “fields”, “type”: “keyword”}
例子:{“find”: “fields”, “type”: “long”}
查找类型为 long 的字段。 - {“find”: “terms”, “field”: “@hostname”, “size”: 1000}
例子:{“find”: “terms”, “field”: “timestamp”, “size”: 1000}
返回字段名称为 timestamp 的列表,大小为1000。 - {“find”: “terms”, “field”: “@hostname”, “query”: “@source:$source”}
例子:{“find”: “terms”, “field”: “timestamp”, “query”: “yjssrc:10”}
返回字段名称为 timestamp 的列表,同时通过过滤器,过滤出字段名称为 yjssrc 值为 10 的数据。
二、lucene查询语法
- 字段
http.code:404
搜素http状态码为404的文档 - 字段本身是否存在
_exists_:http: 返回结果中需要有http的字段
_missing_:http: 不能含有http 字段 - 通配符
?匹配单个字符
*匹配0到多个字符
注意:?、*不能用作第一个字符 - 正则
es支持部分正则功能,性能较差
eg:name:/joh?n(ath[oa]n)/ - 模糊搜索
~:在一个单词后面加上 ~ 可以启用模糊搜素,可以搜到一些拼写错误的单词
first~ 也能匹配first单词
还可以设置编辑距离(整数),指定需要多少相似度
cromm~1 会匹配到 from 和 chrome
默认2,越大越接近搜索的原始值,设置为1基本能搜到80%拼写错误的单词 - 近似搜索
在短语后面加上 ~ ,可以搜到被隔开或顺序不同的单词
“where select”~5 表示 select 和 where 中间可以隔着5个单词,可以搜到 select password from users where id=1 - 范围搜索
length:[100 TO 200]
sip:[“172.24.20.110” TO “172.24.20.140”]
date:{“now-6h” TO “now”}
tag:{b TO e} 搜索b到e中间的字符
count:[10 TO *] * 表示一端不限制范围
count:[1 TO 5} [ ] 表示端点数值包含在范围内,{ } 表示端点数值不包含在范围内,可以混合使用,此语句为1到5,包括1,不包括5
可以简化成以下写法:
age:>10
age:<=10
age:(>=10 AND <20) - 优先级
quick^2 fox
使用^使一个词语比另一个搜索优先级更高,默认为1,可以为0~1之间的浮点数,来降低优先级 - 逻辑操作
AND
OR+:搜索结果中必须包含此项
-:不能含有此项
+apache -jakarta test aaa bbb:结果中必须存在apache,不能有jakarta,剩余部分尽量都匹配到 - 分组
(jakarta OR apache) AND jakarta - 字段分组
title:(+return +“pink panther”)
host:(baidu OR qq OR google) AND host:(com OR cn) - 转义特殊字符
+ - = && || > < ! ( ) { } [ ] ^ " ~ * ? : \ /
以上字符当作值搜索的时候需要用\转义
(1+1)=2用来查询(1+1)=2