########################20200525elasticsearch 权威指南学习###############
空查询,返回所有的索引下的所有文档
GET _search
可以通过指定timeout来让数据在指定的时间内返回已经查询到的数据,timeout 不是停止执行查询,它仅仅是告知正在协调的节点返回到目前为止收集的结果并且关闭连接。
GET _search?timeout=1ms
可以通过,直接索引多个index下的数据
GET raven,raven_index/_search
#在分布式系统中深度分页
###理解为什么深度分页是有问题的,我们可以假设在一有 5 个主分片的索引中搜索。当我们请求结果的第一页(结果从 1 到 10),每一个分片产生前 10 的结果,并且返回给协调节点 ,协调节点对 50个结果排序得到全部结果的前 10 个。
###现在假设我们请求第 1000 页—结果从 10001 到 10010 #。所有都以相同的方式工作除了每个分片不得不产生前#10010个结果以外。 然后协调节点对全部 50050 #个结果排序最后丢弃掉这些结果中的 50040 个结果。
###可以看到,在分布式系统中,对结果排序的成本随分页#的深度成指数上升。这就是 web #搜索引擎对任何查询都不要返回超过 1000 #个结果的原因。
#分页
GET goods/_search?size=20&from=0
GET goods/_search
{
“size”: 20
, “from”: 0
}
GET goods/_mapping
可以通过_analyze进行对term进行分词测试,可以通过field指定使用某个字段的分词方式
GET goods/_analyze
{
“field”: “brandName”
, “text”: [“张三爱吃鱼”]
}
GET goods/_analyze
{
“field”: “title”
, “text”: [“张三爱吃鱼”]
}
PUT users/_doc/1
{
“tweet”: “Elasticsearch is very flexible”,
“user”: {
“id”: “@johnsmith”,
“gender”: “male”,
“age”: 26,
“name”: {
“full”: “John Smith”,
“first”: “John”,
“last”: “Smith”
}
}
}
GET users/_mapping
可以通过名称引用索引具体的字段
GET users/_search
{
“query”: {
“match”: {
“user.name.first”: “John”
}
}
}
可以通过_validate-query /ˈvælɪdeɪt/验证查询 API来验证我们的查询是否合法
下面的查询就会返回valid为false 因为match写错了
POST goods/_validate/query
{
“query”: {
“matc”: {
“title”: “手机”
}
}
}
如果想知道错误的原因 可以在后面加上explain参数 对于合法查询,使用explain参数将返回可读的描述,
POST goods/_validate/query?explain
{
“query”: {
“match”: {
“title”: “手机”
}
}
}