elasticsearch文档Delete By Query API(二)

执行结果如下:

640?wx_fmt=png

此API的优势在于它可以集成 wait_for_completion=false,进而透明地返回任务执行状态。如果任务已完成并且 wait_for_completion=false也已经设置,则它将返回 results或者一个error字段,使用这个功能的会自动创建.tasks/task/${taskId},当然开发者可以删除该文档。

5.Works with the Cancel Task API

任何的 deletebyquery操作都可以使用Task Cancel API取消,如下:

curl -X POST “localhost:9200/_tasks/r1A2WoRbTwKZ516z6NEs5A:36619/_cancel?pretty”

通过上一小节的请求可以获取到Task ID。

取消应该尽快操作但是依然可能需要花费几秒钟,上面的Task API也会列出Task,直到该Task被唤醒取消自己。

6.Rethrottling

requestpersecond的值可以在 deletebyquery期间使用 _rethrottle API进行修改:

curl -X POST “localhost:9200/_delete_by_query/r1A2WoRbTwKZ516z6NEs5A:36619/_rethrottle?requests_per_second=-1”

通过上一小节的请求可以获取到Task ID。

就像在 _delete_by_query API中设置节流参数一样, request_per_second如果为-1表示禁用限制,或者任何十进制数字,如1.7或12,以节流到该级别,对于加速查询的会立即生效,但是对于减慢查询的,则是在完成当前批处理之后才会生效,这样可以防止滚动超时。

7.Slicing

delete by query 支持 sliced scroll 进而实现并行化删除,这种并行化可以提高效率,并提供一种方便的方法将请求分解为更小的部分。

7.1 Manually slicingedit

首先可以手动的进行并行化处理,如下:

curl -X POST “localhost:9200/twitter/_delete_by_query?pretty” -H ‘Content-Type: application/json’ -d’

{

“slice”: {

“id”: 0,

“max”: 2

},

“query”: {

“range”: {

“likes”: {

“lt”: 10

}

}

}

}

curl -X POST “localhost:9200/twitter/_delete_by_query?pretty” -H ‘Content-Type: application/json’ -d’

{

“slice”: {

“id”: 1,

“max”: 2

},

“query”: {

“range”: {

“likes”: {

“lt”: 10

}

}

}

}

开发者只需要指定一个slice id和slice数量即max,这里的slice id不能大于max。

接下来通过如下方式可以验证:

curl -X GET “localhost:9200/_refresh?pretty”

curl -X POST “localhost:9200/twitter/_search?size=0&filter_path=hits.total&pretty” -H ‘Content-Type: application/json’ -d’

{

“query”: {

“range”: {

“likes”: {

“lt”: 10

}

}

}

}

一个合理的执行结果类似下面这样:

640?wx_fmt=png

7.2 Automatic slicingedit

开发者还可以通过使用切片的 _uid来让 deletebyquery自动并行执行,此时,只需要指定slices数量即可,如下:

curl -X POST “localhost:9200/bank/_delete_by_query?refresh&slices=5&pretty” -H ‘Content-Type: application/json’ -d’

{

“query”: {

“match_all”: {}

}

}

执行结果如下,可以看到每次删除的文档数量:

640?wx_fmt=png

开发者也可以通过如下请求去验证:

curl -X POST “localhost:9200/bank/_search?size=0&filter_path=hits.total&pretty” -H ‘Content-Type: application/json’ -d’

{

“query”: {

“match_all”: {}

}

}

验证结果如下:

640?wx_fmt=png

设置slices为auto将让Elasticsearch选择要使用的切片数,此设置将使每个分片一个切片,达到限制后,如果有多个源索引,它将根据具有最小分片数量的索引选择切片数。

将slices添加到deleteby_query中可以自动执行上述手动切片过程,创建子请求,这意味着它有如下特点:

  1. 开发者可以在Tasks API中查看这些请求,这些子请求是具有slices请求任务的“子”任务。

  2. 获取slices请求的状态仅包含已完成切片的状态。

最后

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Java工程师,想要提升技能,往往是自己摸索成长,自己不成体系的自学效果低效漫长且无助。

因此收集整理了一份《2024年Java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Java开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!

如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
671086108)]

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Java开发知识点,不论你是刚入门Java开发的新手,还是希望在技术上不断提升的资深开发者,这些资料都将为你打开新的学习之门!

如果你觉得这些内容对你有帮助,需要这份全套学习资料的朋友可以戳我获取!!

由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值