0. 前言
- 使用SOLR的时候我是抗拒的,又应为项目只能用SOLR实现需要,没有办法只能硬着头皮来做,如果实现没办法可以看看下文。
- 在做的过程中,SOLR这个技术栈可能用的少,国内的文字写的都是基本应用,facet query都很少使用,我的需求也无法满足,只能自己找两本去读,来研究SOLR,也把成果记录下来,分享给大家。
1. 分组
- 我们经常在MySQL中使用group实现分组,虽然SOLR中也提供了Group参数,实现分组,但是只能实现一级分组。
- 当然SOLR也可以实现二级分组或多级,有两种方案
-
通过facet.pivot实现,优点是结构清晰,SolrQuery实现容易,缺点是获取的分组结果只有总和数量(获取不到具体的数据内容),如果想要加入统计函数,就必须通过Solr的stats工具实现。
- 实现分组
-
facet.pivot=key1,key2
- 实现分组加查询
-
?q=:&facet query={!tag=zt1 key=”level1”}ZT:1&facet=true&facet.pivot={!query=zt1}key1,key2&rows=0
- 实现分组加统计
-
?q=:&stats=true&stats.field={!tag=piv1}TS&facet=true&facet.pivot={!stats=piv1}key1,key2&rows=0
-
通过json.facet实现,优点是基于分组,对内容进行处理,缺点就是查询结构必须是JSON格式,不容易调试,功能很强大。
- 参考
-
json.facet={key1:{type:terms,limit:-1,field:key1,facet:{key2:{type:terms,limit:-1,field:key2}}}}
- 在JSON基础上添加聚合函数
-
json.facet={key1:{type:terms,limit:-1,field:key1,facet:{key2:{type:terms,limit:-1,field:key2,facet:{max:‘max(ms(NOW,RQ))’,avg:‘avg(ms(NOW,RQ))’}}}}}
-
2. 注意点
-
先看SOLR版本,低版本不支持这两种方案
-
通过facet查询的时候,如果数据高于100条,需要设置FacetLimit,不然只会显示100条数据
query.setFacetLimit(-1);
-
使用json.facet的时候,也需要在内部添加limit:-1
-
如果SOLR是高版本,报错不支持聚合函数,那就可能是函数接受的这个字段是不支持的类型,改下字段类型就可以了。
3. 参考书籍
- SOLR权威指南下卷