Solr --- Stats聚合统计

转载 2016年06月01日 15:31:51


一、概述

       Solr可以利用StatsComponent 实现数据库的聚合统计查询,也就是min、max、avg、count、sum的功能

 

二、参数

参数 含义
stats 是否开启stats(true/false)
stats.field 添加一个字段来统计,可以有多个
stats.facet  在给定的面返回值的子结果。

 

三、参考实例

参考实例一:查询参数

 

Java代码  收藏代码
  1. q=*:*   
  2. &stats=true  
  3. &stats.field=price  
  4. &stats.field=popularity  
  5. &rows=0  

 返回结果如下:

 

 

Java代码  收藏代码
  1. <lst name="stats">  
  2.  <lst name="stats_fields">  
  3.   <lst name="price">  
  4.     <double name="min">0.0</double>        --最小值  
  5.     <double name="max">2199.0</double>     --最大值  
  6.     <double name="sum">5251.2699999999995</double> --总和  
  7.     <long name="count">15</long>                   --记录数,也就是多少行记录  
  8.     <long name="missing">11</long>                 --结果集中,有多少条记录是空值  
  9.     <double name="sumOfSquares">6038619.160300001</double> --平方和(x1^2 + x2^2+xn^2)  
  10.     <double name="mean">350.08466666666664</double>        --平均数(x1+x2+xn)/n  
  11.     <double name="stddev">547.737557906113</double>        --标准差  
  12.   </lst>  
  13.   <lst name="popularity">  
  14.     <double name="min">0.0</double>  
  15.     <double name="max">10.0</double>  
  16.     <double name="sum">90.0</double>  
  17.     <long name="count">26</long>  
  18.     <long name="missing">0</long>  
  19.     <double name="sumOfSquares">628.0</double>  
  20.     <double name="mean">3.4615384615384617</double>  
  21.     <double name="stddev">3.5578731762756157</double>  
  22.   </lst>  
  23.  </lst>  
  24. </lst>  

 参数含义如下:

返回字段 字段含义
min 最小值
max 最大值
sum 总和
count 记录数,也就是多少行记录
missing 结果集中,有多少条记录是空值
sumOfSquares 平方和(x1^2 + x2^2+xn^2)
mean  平均数(x1+x2+xn)/n
stddev 标准差

 

 

参考实例二:查询参数如下

 

Java代码  收藏代码
  1. q=*:*   
  2. &stats=true  
  3. &stats.field=price  
  4. &stats.field=popularity  
  5. &stats.facet=inStock  
  6. &rows=0  

返回结果如下所示:

 

 

Java代码  收藏代码
  1. <lst name="stats">  
  2.  <lst name="stats_fields">  
  3.   <lst name="price">  
  4.   <double name="min">0.0</double>  
  5.   <double name="max">2199.0</double>  
  6.   <double name="sum">5251.2699999999995</double>  
  7.   <long name="count">15</long>  
  8.   <long name="missing">11</long>  
  9.   <double name="sumOfSquares">6038619.160300001</double>  
  10.   <double name="mean">350.08466666666664</double>  
  11.   <double name="stddev">547.737557906113</double>  
  12.   <lst name="facets">  
  13.    <lst name="inStock">  
  14.     <lst name="false">  --统计的是:在返回结果中inStock等于false部分,price的统计  
  15.       <double name="min">11.5</double>   --在inStock等于false的记录中pirce的最小值  
  16.       <double name="max">649.99</double> --在inStock等于false的记录中pirce的最大值  
  17.       <double name="sum">1161.39</double>--在inStock等于false的记录中pirce的总和  
  18.       <long name="count">4</long>        --inStock等于false的记录数  
  19.       <long name="missing">0</long>      --在inStock等于false的记录中pirce等于空的记录  
  20.       <double name="sumOfSquares">653369.2551</double>--在inStock等于false的记录中pirce的平方和  
  21.       <double name="mean">290.3475</double>--在inStock等于false的记录中pirce的平均值  
  22.       <double name="stddev">324.63444676281654</double>--在inStock等于false的记录中pirce的标准差  
  23.     </lst>  
  24.     <lst name="true">  
  25.       <double name="min">0.0</double>  
  26.       <double name="max">2199.0</double>  
  27.       <double name="sum">4089.879999999999</double>  
  28.       <long name="count">11</long>  
  29.       <long name="missing">0</long>  
  30.       <double name="sumOfSquares">5385249.905200001</double>  
  31.       <double name="mean">371.8072727272727</double>  
  32.       <double name="stddev">621.6592938755265</double>  
  33.     </lst>  
  34.    </lst>  
  35.   </lst>  
  36.  </lst>  
  37. </lst>  

  

 

温馨提示:如果统计的列不是数字类型。而是字符串,那么统计的结果中只有如下列

参考实例如下:查询参数

Java代码  收藏代码
  1. q=*:*  
  2. &stats=true  
  3. &stats.field=CAR_NUM  
  4. &rows=0  

 返回结果如下所示:

 

Java代码  收藏代码
  1. <lst name="stats">  
  2.   <lst name="stats_fields">  
  3.     <lst name="CAR_NUM">  
  4.         <str name="min">08449</str>  
  5.         <str name="max">黑ZZ6T8警</str>  
  6.         <long name="count">9999999</long>  
  7.         <long name="missing">0</long>  
  8.         <lst name="facets"/>  
  9.     </lst>  
  10.    </lst>  
  11. </lst>  

solr中facet及facet.pivot理解(整合两篇文章保留参考)

Facet['fæsɪt]很难翻译,只能靠例子来理解了。Solr作者Yonik Seeley也给出更为直接的名字:导航(Guided Navigation)、参数化查询(Paramatic Searc...
  • a925907195
  • a925907195
  • 2014年12月29日 18:00
  • 4639

solr facet查询及solrj 读取facet数据

solr facet查询及solrj 读取facet数据
  • makang110
  • makang110
  • 2016年07月07日 15:35
  • 1172

Solr分组聚合查询之Facet

摘要: Solr的分组聚合是一个笼统的概念,目的就是把查询结果做分类,有多种方式可以做到很类似的结果。也正是由于它们的不同表现,可以适合于多种场景。何为FacetFacet是一种手段,用来将搜索结果分...
  • jiangchao858
  • jiangchao858
  • 2017年03月14日 23:24
  • 2167

Solr --- 聚合统计stats

简介 stats查询用于对文档中的数字型、字符型和日期型字段进行简单的统计。 查询语法 输入: q=apple&stats=true&stats.field=price&stats.fie...
  • zhufenglonglove
  • zhufenglonglove
  • 2016年06月22日 17:48
  • 431

Solr.NET快速入门(六)【聚合统计,分组查询】

聚合统计 属性 说明 Min 最小值 Max 最大值 Sum 总和 Count 记录数,也就是多少行记录 Missing 结果集中,有多少条记录是空值 ...
  • WuLex
  • WuLex
  • 2017年03月18日 22:22
  • 798

W-Stats v0.79b(流量统计)

  • 2004年08月19日 10:55
  • 44KB
  • 下载

中国国家统计局统计用区划代码和城乡划分代码www_stats_gov_cn_tjbz_cxfldm_2011

  • 2013年05月05日 19:48
  • 5.61MB
  • 下载

用solr的facet实现聚合标签

Facet,单词意思是侧面,小平面。哈哈,怎么学英文单词了…… 好吧,言归正题,solr的Facet是一个什么东西呢?我个人理解,反映一个搜索词的小平面(或者说某一个分组),起到标签聚合统计的功能...
  • zpc15200790194
  • zpc15200790194
  • 2014年04月07日 22:25
  • 586

SolrJ 对 solr 及 solrCloud 的连接、简单查询和facet聚合查询的简单样例以及显示数据评分score

导语:使用Solr为Java提供的api,SolrJ对solr及solrCloud的连接、简单查询和facet聚合查询的简单样例,目前使用的是solr4.10.3。 1.对solrJ的介绍    S...
  • liuqinshouss
  • liuqinshouss
  • 2017年08月06日 14:18
  • 825

Solr中文字段的查询与字段分词后如何聚合查询的问题

问题描述: 问题一:  比如数据里面有个叫name的字段,存储的是用户名,如果name字段使用的fieldType配置了英文分词,那么我们对于这个字段的查询结果会有错误。比如,查询“张三”,那么像“张...
  • liuqinshouss
  • liuqinshouss
  • 2017年08月02日 22:00
  • 746
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Solr --- Stats聚合统计
举报原因:
原因补充:

(最多只允许输入30个字)