12.elasticsearch文档Delete By Query API(一)
4.Works with the Task API
开发者可以利用Task API获取任何正在运行的 deletebyquery
操作的状态,如下:
curl -X GET “localhost:9200/_tasks?detailed=true&actions=*/delete/byquery&pretty”
请求执行结果类似下面这样:
这个对象包含实际状态,和elasticsearch文档Delete By Query API(一)中提到的Response Body类似,不同的是这里增加了total字段,total是reindex期望执行的操作总数,开发者可以通过添加updated,created以及deleted字段来估计进度,请求将在这些字段总和等于total字段时结束。
通过Task ID,开发者可以直接查找任务,如下:
curl -X GET “localhost:9200/_tasks/j3neBny-TnKarVjzXIC3Eg:6736?pretty”
执行结果如下:
此API的优势在于它可以集成 wait_for_completion=false
,进而透明地返回任务执行状态。如果任务已完成并且 wait_for_completion=false
也已经设置,则它将返回 results或者一个error字段,使用这个功能的会自动创建.tasks/task/${taskId},当然开发者可以删除该文档。
5.Works with the Cancel Task API
任何的 deletebyquery
操作都可以使用Task Cancel API取消,如下:
curl -X POST “localhost:9200/_tasks/r1A2WoRbTwKZ516z6NEs5A:36619/_cancel?pretty”
通过上一小节的请求可以获取到Task ID。
取消应该尽快操作但是依然可能需要花费几秒钟,上面的Task API也会列出Task,直到该Task被唤醒取消自己。
6.Rethrottling
requestpersecond的值可以在 deletebyquery
期间使用 _rethrottle
API进行修改:
curl -X POST “localhost:9200/_delete_by_query/r1A2WoRbTwKZ516z6NEs5A:36619/_rethrottle?requests_per_second=-1”
通过上一小节的请求可以获取到Task ID。
就像在 _delete_by_query
API中设置节流参数一样, request_per_second
如果为-1表示禁用限制,或者任何十进制数字,如1.7或12,以节流到该级别,对于加速查询的会立即生效,但是对于减慢查询的,则是在完成当前批处理之后才会生效,这样可以防止滚动超时。
7.Slicing
delete by query 支持 sliced scroll
进而实现并行化删除,这种并行化可以提高效率,并提供一种方便的方法将请求分解为更小的部分。
7.1 Manually slicingedit
首先可以手动的进行并行化处理,如下:
curl -X POST “localhost:9200/twitter/_delete_by_query?pretty” -H ‘Content-Type: application/json’ -d’
{
“slice”: {
“id”: 0,
“max”: 2
},
“query”: {
“range”: {
“likes”: {
“lt”: 10
}
}
}
}
’
curl -X POST “localhost:9200/twitter/_delete_by_query?pretty” -H ‘Content-Type: application/json’ -d’
{
“slice”: {
“id”: 1,
“max”: 2
},
“query”: {
“range”: {
“likes”: {
“lt”: 10
}
}
}
}
’
开发者只需要指定一个slice id和slice数量即max,这里的slice id不能大于max。
接下来通过如下方式可以验证:
curl -X GET “localhost:9200/_refresh?pretty”
curl -X POST “localhost:9200/twitter/_search?size=0&filter_path=hits.total&pretty” -H ‘Content-Type: application/json’ -d’
{
“query”: {
“range”: {
“likes”: {
“lt”: 10
}
}
}
}
’
一个合理的执行结果类似下面这样:
7.2 Automatic slicingedit
开发者还可以通过使用切片的 _uid
来让 deletebyquery
自动并行执行,此时,只需要指定slices数量即可,如下:
curl -X POST “localhost:9200/bank/_delete_by_query?refresh&slices=5&pretty” -H ‘Content-Type: application/json’ -d’
{
“query”: {
“match_all”: {}
}
}
’
最后
一次偶然,从朋友那里得到一份“java高分面试指南”,里面涵盖了25个分类的面试题以及详细的解析:JavaOOP、Java集合/泛型、Java中的IO与NIO、Java反射、Java序列化、Java注解、多线程&并发、JVM、Mysql、Redis、Memcached、MongoDB、Spring、Spring Boot、Spring Cloud、RabbitMQ、Dubbo 、MyBatis 、ZooKeeper 、数据结构、算法、Elasticsearch 、Kafka 、微服务、Linux。
这不,马上就要到招聘季了,很多朋友又开始准备“金三银四”的春招啦,那我想这份“java高分面试指南”应该起到不小的作用,所以今天想给大家分享一下。
请注意:关于这份“java高分面试指南”,每一个方向专题(25个)的题目这里几乎都会列举,在不看答案的情况下,大家可以自行测试一下水平 且由于篇幅原因,这边无法展示所有完整的答案解析
itMQ、Dubbo 、MyBatis 、ZooKeeper 、数据结构、算法、Elasticsearch 、Kafka 、微服务、Linux。
这不,马上就要到招聘季了,很多朋友又开始准备“金三银四”的春招啦,那我想这份“java高分面试指南”应该起到不小的作用,所以今天想给大家分享一下。
[外链图片转存中…(img-wrZtGo9t-1716573858005)]
请注意:关于这份“java高分面试指南”,每一个方向专题(25个)的题目这里几乎都会列举,在不看答案的情况下,大家可以自行测试一下水平 且由于篇幅原因,这边无法展示所有完整的答案解析