Solr聚合查询

1  分组查询

概述:Solr常用的分组查询有两种,Facet分组和Group分组,分别以下列出这两种查询:

1.1     Facet分组

solr种以导航为目的的查询结果成为facet,在用户查询的结果上根据分类增加了count信息,然后用户根据count信息做进一步搜索,

 Facet是solr的高级搜索功能之一,可以给用户提供更友好的搜索体验.在搜索关键字的同时,能够按照Facet的字段进行分组并统计。

 

Solr Fact提供了4种类型的Fact

<lstname="facet_counts"> 
  <lstname="facet_queries"/> 
  <lstname="facet_fields"/> 
  <lstname="facet_dates"/> 
  <lstname="facet_ranges"/> 
</lst> 
facet_queries:代表自定义条件查询facet,类似数据库的count函数
facet_fields    :代表根据字段分组查询,类似数据库的groupby count的组合
facet_dates:根据日期区间分组查询
facet_ranges:当然了,日期有区间,数字也有,这个就是根据数字分组查询


 

 

说明:

facet的基本功能就是对搜索结果中的数据进行分类。

facet用法

facet.field:指定要分类的字段
facet=on 或 facet=true表示功能开启
facet.prefix 表示字段前缀
facet.limit 表示返回的记录数
facet.offict 表示从第几条开始,主要用于分页
facet.query可以任意定义查询
  


Range Facet

一般用于date类型或数字类型的字段。

&facet=on
&facet.query=date:[2009-1-1T0:0:0ZTO 2010-1-1T0:0:0Z]


 

参数说明

facet.range   需要做facet查询的字段
facet.range.start      设置起始点
facet.range.end       设置终止点
facet.range.gap       限定每一段范围的区间差值
facet.range.hardend          指定如何处理最后一个区间
facet.range.include 指定如何处理临界值
facet.range.other    指定如何处理限定范围以为的结果
facet.range.method           指定facet算法

如下查询:

http://localhost:8983/solr/solr_select/query?q=*:*&facet=on&facet.field=name

根据name字段分组查询结果




1.2     Group分组

Solr对结果的分组处理除了facet还可以使用group。Solr的group是根据某一字段对结果分组,将每一组内满足查询的结果按顺序返回。

Group对比Facet

Group和Facet的概念很像,都是用来分组。Facet返回所有相关的结果并允许用户基于facet的目录重新定义结果集。Facet可以对分组数量进行过滤,以及排序,和日期范围,时间范围分组,但是如果你想得到具体的数据,还得需要查询一次或多次。group可以得到分组的组数量,一次请求,可以拿到所有的数据。

Group和Facet可以结合起来使用,但只能使用facet.field和facet.range,还不支持日期date和维度统计pivot faceting.

如下查询:

http://localhost:8983/solr/solr_select/query?q=*:*&group=true&group.field=name


 

参数说明:

 

参数 类型 说明
group 布尔值 设为true,表示结果需要分组
group.field 字符串 需要分组的字段,字段类型需要时是StrField或TextField
group.func 查询语句 可以指定查询函数
group.query 查询语句 可以指定查询语句
rows 整数 返回多少组结果,默认10
start 整数 指定结果开始位置/偏移量
group.limit 整数 每组返回多数条结果,默认1
group.offset 整数 指定每组结果开始位置/偏移量
sort 排序算法 控制各个组的返回顺序
group.sort 排序算法 控制每一分组内部的顺序
group.format grouped/simple 设置为simple可以使得结果以单一列表形式返回
group.main 布尔值 设为true时,结果将主要由第一个字段的分组命令决定
group.ngroups 布尔值 设为true时,Solr将返回分组数量,默认fasle
group.truncate 布尔值 设为true时,facet数量将基于group分组中匹相关性高的文档,默认fasle
group.cache.percent 整数0-100 设为大于0时,表示缓存结果,默认为0。该项对于布尔查询,通配符查询,模糊查询有改善,却会减慢普通词查询。




2      Stats Component聚合查询

摘要: Solr可以利用StatsComponent实现对数字、字符串或日期字段的聚合统计查询即:minmaxavgcountsum的功能

 

Stats Component参数说明:

参数 描述
stats 布尔值,设为true,表示开启Stats Component
stats.field 指定需要做统计的字段
stats.facet 对指定的facet生成一个子结果集
stats.calcdistinct 布尔值,将会返回”countDistinct”和”distinctValues”,其代价很高。默认fasle

 

stats Component统计内容

统计项目 描述 支持的类型 是否默认输出
min 最小值 所有
max 最大值 所有
sum 数字、日期
count 个数 所有
missing 空值的个数 所有
sumOfSquares 平方和 数字、日期
mean 均值 数字、日期  
stddev 标准差 数字、日期
percentiles 精度/小数点后几位 数字
distinctValues set/不重复值集合 所有
countDistinct set精确个数/不重复值集合大小,使用代价很大 所有
cardinality set个数/不重复值集合大小,可能不准确 所有

 

如下查询:

http://localhost:8983/solr/solr_select/select?q=*:*&stats=true&stats.field=id&rows=0&indent=true


  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 如果你想在Solr中执行分组查询,并且你的字段包含多个值,你可以使用Solr的多值分组功能。为了使用这个功能,你需要使用Solr的分组查询语法,并在查询中指定“group.field”参数来指定要分组的字段。然后,您可以使用Solr的“group.limit”参数来指定每个分组中包含的文档数的最大值。这将确保您的分组查询结果仅包含与每个分组相关的最相关文档。从Solr 4.0开始,您还可以使用Solr的“group.format”参数来指定分组查询结果的格式,以便更好地满足您的需求。 ### 回答2: Solr是一个强大的搜索引擎,可以用于进行高效的分组查询。当我们需要对包含多个值的字段进行分组查询时,可以通过使用Solr的facet功能来实现。 在Solr中,可以使用facet.field参数指定要进行分组的多值字段。例如,如果我们有一个字段名为"tags",该字段包含多个标签,可以通过将facet.field设置为"tags"来进行分组查询。在搜索请求中,我们需要设置facet参数为true来启用分组查询。 当我们执行搜索请求时,Solr会计算每个标签的出现次数,并返回每个标签及其对应的文档数。这样,我们可以获得每个标签的分组统计信息。 我们还可以通过设置facet.limit参数来限制返回的分组结果数量。如果我们想要获取前n个最常见的标签,可以将facet.limit设置为n。 另外,我们还可以对分组结果进行排序,以便按照某个特定的标准对标签进行排序。例如,我们可以使用facet.sort参数将分组结果按照文档数目或者标签名称进行排序。 除了对整个多值字段进行分组查询,我们还可以在分组查询中指定条件。例如,我们可以使用facet.query参数来指定额外的条件,并对满足条件的文档进行分组查询。 总结来说,Solr可以通过使用facet功能对包含多个值的字段进行分组查询。我们可以指定要进行分组的字段,并可以设置额外的条件、排序和限制来获取所需的分组统计信息。 ### 回答3: Solr是一个开源的搜索平台,它支持多值字段的分组查询。在Solr中,可以使用facet查询来实现分组查询,并且可以应用于包含多值的字段。 要对包含多值的字段进行分组查询,首先需要在solrconfig.xml文件中配置相应的字段类型。可以使用Solr提供的一些已有的多值字段类型,例如"string_mv"、"text_general_mv"等,也可以根据需要自定义字段类型。 在查询时,可以使用facet.field参数指定需要进行分组查询的字段名。当指定的字段是一个多值字段时,Solr会根据每个值进行分组。结果中将包含该字段的每个值作为分组的key,并统计每个分组出现的次数。 例如,假设有一个包含多个标签的字段"tags",现在需要对"tags"字段进行分组查询。可以使用如下查询语句: ``` /select?q=*:*&facet=true&facet.field=tags ``` 执行该查询后,Solr将返回一个结果集,其中包含了"tags"字段的每个值作为分组的key,并统计了每个分组出现的次数。这样就实现了对包含多值的字段进行分组查询。 需要注意的是,对于大量数据或者需要更复杂的聚合操作的情况,可能需要使用更高级的分组查询功能,例如利用facet.pivot参数进行多级分组或者使用facet.query参数进行条件过滤等。 综上所述,Solr支持对包含多值的字段进行分组查询,通过配置字段类型和使用facet查询参数,可以轻松实现这一功能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值