网上对于定时删除 ElasticSearch 索引数据有相当多的文章,有一些是借助 Curator 工具实现,有一些通过 ElasticSearch 的 delete_by_query 语句实现。
事实上这几种都可以实现我们想要定期删除数据的效果,粗略翻看了一下(本王还没来得及细看),可以这么理解:
- delete_by_query 语句适合删除指定索引中的指定数据,例如删除索引 error_log 中距今超过 5 天的数据;
- Curator 工具适合删除指定的索引,例如删除索引 error_log_2020-12;
相关文档 delete_by_query、Curator
具体用哪一种方式,大家可以根据自己的需求来定。不过这两种方式都需要使用 Crontab 来实现定时,下面我以 delete_by_query 语句演示如何定时删除指定索引中的指定数据。
原理与基本语法
点击上面提供的文档链接跳转到 delete_by_query 的文档,文档给出的示例为:
POST /my-index-000001/_delete_by_query
{
"query": {
"match": {
"user.id"