Apache Solr提供了丰富的查询语法,支持复杂的全文搜索、精确匹配、范围查询、布尔逻辑组合等多种查询操作。以下是一些常用的Solr查询语法示例:
1. 基本字段查询
查询特定字段中包含特定值的文档。使用冒号(::
)代替等号(=
, SQL风格)来指定字段和值的关系。例如:
title:电子书
author:张三
price:[10 TO 50] # 价格在10到50之间的商品
2. 分词与非分词查询
-
默认分词查询:Solr会对查询词进行分词。例如,查询
title:计算机科学
会匹配标题中包含“计算机”和“科学”的文档。 -
非分词查询(精确匹配):使用双引号(
""
)包围查询词,表示整个短语作为一个整体进行精确匹配。例如,查询title:"计算机科学"
将只匹配标题中包含完整短语“计算机科学”的文档。
3. 通配符查询
使用星号(*
)和问号(?
)进行通配符查询:
*
表示零个或多个任意字符。?
表示一个任意字符。
例如:
title:*电子书 # 匹配标题中以“电子书”结尾的文档
title:计算机? # 匹配标题中包含“计算机”后面跟着一个任意字符的文档
4. 布尔逻辑操作
使用布尔运算符进行条件组合:
-
AND:所有条件都必须满足。可以使用空格(
AND
关键字表示。例如:title:电子书 AND author:李四
-
OR:满足任一条件即可。使用
OR
关键字表示。例如:title:计算机 OR title:科学
-
NOT:排除满足特定条件的文档。使用
NOT
或-
符号表示。例如:title:计算机 NOT title:科学 title:电子书 -author:张三
5. 范围查询
查询某个字段值在指定区间内的文档。使用方括号([]
)表示闭区间(包括边界),尖括号(< >
)表示开区间(不包括边界)。例如:
price:[10 TO 50] # 价格在10到50之间(包括10和50)
price:{10 TO 50} # 价格在10到50之间(不包括10和50)
price:[* TO 100] # 价格小于等于100
price:<100 # 价格小于100
6. 通配符与模糊查询
-
模糊查询:使用 tilde (
~
) 符号后跟一个可选的编辑距离(Levenshtein距离)。例如,查询title:comp~
将匹配与comp
编辑距离在默认阈值(通常为2)内的单词,如computer
、complement
等。 -
邻近搜索(Proximity Search):使用波浪线 (
~
) 后跟一个数字表示两个词之间的最大距离。例如,查询"big apple"~5
将查找包含短语“big apple”,且两个词之间最多间隔5个词的文档。
7. 分面(Faceting)
指定要进行分面统计的字段,以及可选的分面参数。例如:
facet=true&facet.field=category&facet.limit=10
这意味着对category
字段进行分面统计,返回前10个最频繁出现的类别。
8. 排序(Sorting)
指定排序字段和排序方向。例如:
sort=price asc # 按照价格升序排列
sort=popularity desc # 按照流行度降序排列
9. 限制结果数量与分页
使用rows
和start
参数控制结果数量和分页:
rows=10&start=20 # 返回第21到第30条结果(每页10条,当前为第3页)
10. 高亮(Highlighting)
指定高亮字段和查询参数,返回查询结果中匹配部分的高亮显示。例如:
hl=true&hl.fl=title&hl.simple.pre=<em>&hl.simple.post=</em>
这将对title
字段的查询匹配部分进行高亮显示,使用HTML标签<em>
包裹高亮内容。
11. 查询参数
q
: 查询字符串,必需参数。fq
(Filter Query):过滤查询,对主查询结果进行二次过滤,不影响得分,常用于筛选条件。wt
(Writer Type):响应格式,如json
、xml
等。fl
(Field List):指定返回结果中包含的字段。
以上仅是Solr查询语法的一部分,实际使用中还可以结合更多的查询参数和高级特性进行复杂查询。请根据实际需求查阅Solr官方文档以获取详细信息和最新功能。