avg聚合
单值度量聚合,计算从聚合文档中提取的数值的平均值。这些值可以从文档中的特定数字字段中提取,也可以由提供的脚本生成。
假设数据由代表学生考试成绩(0到100)的文档组成,我们可以用以下公式对他们的分数进行平均:
POST /exams/_search?size=0
{
"aggs" : {
"avg_grade" : { "avg" : { "field" : "grade" } }
}
}
--------------------------------------------------------------
curl -XPOST "http://localhost:9200/exams/_search" -H 'Content-Type: application/json' -d'{ "aggs": { "avg_grade": { "avg": { "field": "grade" } } }}'
上面的聚合计算所有文档的平均等级。聚合类型为avg,字段设置定义将计算平均值的文档的数字字段。上面将返回以下内容:
{
...
"aggregations": {
"avg_grade": {
"value": 75.0
}
}
}
聚合的名称(上面的avg_级别)也用作键,通过该键可以从返回的响应中检索聚合结果。
脚本
根据脚本计算平均成绩:
POST /exams/_search
{
"aggs": {
"avg_grade": {
"avg": {
"script": {
"source": "doc.grade.value"
}
}
}
}
}
--------------------------------
curl -XPOST "http://localhost:9200/exams/_search" -H 'Content-Type: application/json' -d'{ "aggs": { "avg_grade": { "avg": { "script": { "source": "doc.grade.value" } } } }}'
这将把脚本参数解释为具有管道脚本语言且没有脚本参数的内联脚本。要使用存储的脚本,请使用以下语法:
POST /exams/_search?size=0
{
"aggs": {
"avg_grade": {
"avg": {
"script": {
"id":"my_script",
"params": {
"field":"grade"
}
}
}
}
}
}
------------------------
curl -XPOST "http://localhost:9200/exams/_search?size=0" -H 'Content-Type: application/json' -d'{ "aggs": { "avg_grade": { "avg": { "script": { "id":"my_script", "params": { "field":"grade" } } } } }}'
脚本值
结果证明,考试远高于学生的水平,需要进行分数修正。我们可以使用值脚本获取新的平均值:
POST /exams/_search?size=0
{
"aggs": {
"avg_corrected_grade": {
"avg": {
"field": "grade",
"script": {
"lang": "painless",
"source": "_value * params.correction",
"params": {
"correction":1.2
}
}
}
}
}
}
---------------------------------------
curl -XPOST "http://localhost:9200/exams/_search?size=0" -H 'Content-Type: application/json' -d'{ "aggs": { "avg_corrected_grade": { "avg": { "field": "grade", "script": { "lang": "painless", "source": "_value * params.correction", "params": { "correction":1.2 } } } } }}'
缺省值
missing
参数定义如何处理缺少值的文档。默认情况下,它们将被忽略,但也可以将它们视为具有值。
POST /exams/_search?size=0
{
"aggs" : {
"grade_avg" : {
"avg" : {
"field" : "grade",
"missing": 10 <1>
}
}
}
}
- grade 字段中没有值的文档与值为10的文档属于同一个存储桶。