也可以一次删除多个索引和多个type,如下:
curl -X POST “localhost:9200/twitter,blog/_doc,post/_delete_by_query?pretty” -H ‘Content-Type: application/json’ -d’
{
“query”: {
“match_all”: {}
}
}
’
请求执行结果如下:
如果开发者使用了路由,那么路由将被拷贝到滚动查询,那么删除操作将在路由相匹配的分片上执行,如下:
curl -X POST “localhost:9200/twitter/_delete_by_query?routing=2&pretty” -H ‘Content-Type: application/json’ -d’
{
“query”: {
“range” : {
“age” : {
“gte” : 10
}
}
}
}
’
执行结果如下:
默认情况下, _delete_by_query
滚动批处理上限为1000,可以在URL中使用 scroll_size
参数更改批量大小:
curl -X POST “localhost:9200/twitter/_delete_by_query?scroll_size=5000” -H ‘Content-Type: application/json’ -d’
{
“query”: {
“term”: {
“user”: “kimchy”
}
}
}
’
2.URL Parameters
除了elasticsearch API约定(二)一文向读者介绍的公共参数如pretty之外, DeleteByQueryAPI
还支持 refresh
、 wait_for_completion
、 wait_for_active_shards
、 timeout
以及 requests_per_second
。
2.1 refresh
发送refresh请求将在删除请求完成后刷新 deletebyquery
中涉及到的所有分片,这不同于elasticsearch文档Delete API一文中提到的refresh参数,后者仅刷新接收删除请求的分片。
2.2 waitforcompletion
如果请求包含 wait_for_completion=false
,则Elasticsearch将执行一些预检查、启动请求、然后返回task,可与Tasks API一起使用来取消或获取任务状态。Elasticsearch还将以.tasks/task/${taskId}作为文档创建此任务的记录,开发者可以自行决定是否保留这个记录,如果删除记录,那么Elasticsearch可以回收它使用的空间。
2.3 waitforactive_shards
waitforactive_shards参数的作用和elasticsearch文档索引API(二)一文中介绍的含义一致,这里不再赘述,读者可以参考该篇文章。
2.4 timeout
timeout控制每个写入请求等待不可用分片变为可用分片的时间。
2.5 scroll
由于 _delete_by_query
采用滚动搜索,你还可以指定 scroll
参数来控制在多长时间保持“搜索上下文”活着,例如添加 ?scroll=10m
参数,默认情况下它是5分钟。
2.6 requestspersecond
requestspersecond可以被设置为任何正十进制数(1.4,6, 1000等),通过该参数可以限制 delete-by-query
发出的每秒请求数量,也可以通过设置requestspersecond=-1来禁用这种限制。
节流是通过在批处理之间等待来实现限制作用,通过在 _delete_by_query
内部的每批次之间填充时间来实现节流,填充时间是批量大小除以requestspersecond与写入操作所花费的时间之间的差异。在默认情况下,批量大小为1000,因此如果requestspersecond设置为500,填充时间计算如下:
target_time = 1000 / 500 per second = 2 seconds
wait_time = target_time - write_time = 2 seconds - .5 seconds = 1.5 seconds
由于批处理是作为单个_bulk请求发出的,因此大数据量的批处理将导致Elasticsearch创建许多请求,然后等待一段时间再开始下一组。这是 bursty
而不是 smooth
。
3.Response body
根据前面的介绍,响应的数据类似于如下格式:
{
“took” : 147,
“timed_out”: false,
“total”: 119,
“deleted”: 119,
“batches”: 1,
“version_conflicts”: 0,
“noops”: 0,
“retries”: {
“bulk”: 0,
“search”: 0
},
“throttled_millis”: 0,
“requests_per_second”: -1.0,
“throttled_until_millis”: 0,
“failures” : [ ]
}
各字段的含义分别如下:
1.took
执行整个操作所耗费的时间,单位为毫秒。
2.timed_out
在整个操作执行过程中,如果发生了任何的请求超时,则将此字段标记为true。
3.total
成功处理的文档数。
4.deleted
成功删除的文档数。
5.batches
通过
deletebyquery
删除的滚动响应数量。
6.version_conflicts
版本冲突数。
7.noops
这个字段在删除响应中始终为0。它的存在只是为了
deletebyquery
、updatebyquery
以及reindexAPIs
具有相同的响应结构。
8.retries
这个是重试次数,bulk是bulk行为的重试次数,search是search行为的重试次数。
9.throttled_millis
请求休眠的毫秒数。
10.requestspersecond
在
deletebyquery
期间每秒执行的请求数。
11.throttleduntilmillis
该字段在
_delete_by_query
响应中应始终等于零,它只在使用Task API时有意义。为了使请求执行满足requests_per_second
,它用来指示下一次throttled request
执行的时间。
12.failures
如果在此过程中存在任何不可恢复的错误,则这个数组将不为空。参考上文,开发者可以使用conflicts选项来防止版本冲突导致操作中止。
好了,本文先说到这里,有问题欢迎留言讨论。
▼往期精彩回顾▼ Redis教程 SpringCloud教程 Git教程 MongoDB教程 SpringBoot+Vue前后端分离开源项目-微人事 SpringBoot+Vue前后端分离开源项目-V部落
最后
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Java工程师,想要提升技能,往往是自己摸索成长,自己不成体系的自学效果低效漫长且无助。
因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Java开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!
如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
c-1715671055278)]
[外链图片转存中…(img-zTh0A8ew-1715671055278)]
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Java开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!
如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!