一个典型的搜索处理过程,以及所需要的参数如下:
- qt:指定一个RequestHandler,即/select,缺省是使用DisMax RequestHandler
- defType:选择一个query parser,缺省是RequestHandler中配置的那个
- qf:指定需要搜索的field,如果不指定就搜索所有的field
- start, rows:指明分页参数
- fq:指明需要如何过滤搜索结果,以及缓存搜索结果
- wt:指定搜索结果的格式,比如json或xml
搜索所需要的参数基本上可以分为三类:
- 需要搜索的字符串
- 调整搜索的参数(指定被搜索的field、为某些field增加权值、等等)
- 搜索结果展示的参数(排序、结果过滤、分页、高亮显示、等等)
搜索请求参数:
参数
|
说明
|
q
|
Query,要搜索的内容。
|
fq
| Filter Query,搜索结果过滤(结果会被缓存起来):
后两种的不同点:前一种:搜索结果分开存在缓存中,然后取交集;后一种:搜索结果存在一个缓存中
|
sort
|
指定搜索结果按照某个域来排序,例子:
|
start, rows
|
返回第start条开始,一共rows条记录,例子:
|
fl
|
Field List,要返回的域,比如“id”、*,如果有多个,用逗号(,)或空格分开,还可以返回score。例子:
|
df
|
Default Field,默认的查询字段,重新指定并覆盖schema.xml中的default field
|
wt
|
Writer,指定一个writer以返回不同的格式,比如:json, xml...
|
facet |
统计查询结果:
按某个域统计:facet=true&facet.field=author(按照“author”这个域统计)
|
defType
|
指定一个Request Handler,然后使用它所配置的parser,比如dismax, edismax来执行搜索。缺省是dismax,即"lucene" parser。dismax、edismax支持为每个被搜索的域指定权值,以影响score。dismax 是 Maximum Disjunction 的缩写。
|
qf
|
Query Field,指定要搜索的域,覆盖df,同时可以为某个域设置权值,需要配合defType=dismax或defType=edismax,例子:
|
注:关于Maximum Disjunction的定义:
A query that generates the union of documents produced by its subqueries, and that scores each document with the maximum score for that document as produced by any subquery, plus a tie breaking increment for any additional matching subqueries.
大概就是:一个查询由若干个子查询组成,每个子查询都有一个得分,总分=最大分+其他子查询的分数×tieBreakerMultiplier。