ES定时清理索引

Coding宇航员

已于 2024-05-29 01:08:20 修改

阅读量4.9k

点赞数

分类专栏：解决方案工具和环境 Linux 文章标签： elasticsearch 中间件 jvm

于 2020-08-11 23:15:43 首次发布

本文链接：https://blog.csdn.net/qq_35425070/article/details/107946304

版权

工具和环境同时被 3 个专栏收录

51 篇文章

订阅专栏

解决方案

41 篇文章

订阅专栏

Linux

20 篇文章

订阅专栏

ES 定时清理索引

请添加图片描述

ES会将索引存放在内存中，以加速查询性能，但如果长期将使用不频繁的数据放入内存，将会浪费我们的一些资源，下面先举例子一个由于无用数据过多导致的问题

自动清理脚本

#!/bin/bash

###################################
#删除早于十天的ES集群的索引
###################################
function delete_indices() {
    comp_date=`date -d "10 day ago" +"%Y-%m-%d"`
    date1="$1 00:00:00"
    date2="$comp_date 00:00:00"

    t1=`date -d "$date1" +%s` 
    t2=`date -d "$date2" +%s` 

    if [ $t1 -le $t2 ]; then
        echo "$1时间早于$comp_date，进行索引删除"
        #转换一下格式，将类似2017-10-01格式转化为2017.10.01
        format_date=`echo $1| sed 's/-/\./g'`
        curl -XDELETE http://127.0.0.1:9200/*$format_date
    fi
}

curl -XGET http://127.0.0.1:9200/_cat/indices | awk -F" " '{print $3}' | awk -F"-" '{print $NF}' | egrep "[0-9]*\.[0-9]*\.[0-9]*" | sort | uniq  | sed 's/\./-/g' | while read LINE
do
    #调用索引删除函数
    echo "delete indexes..."
    delete_indices $LINE
    echo "deleted success"
done

不清理的危害

我有一个自己的服务器，部署了一些常见的中间件docker容器，通过 fluentd 将他们的日志输出到 ES中，在 kibana 中进行展示。
有天手机收到邮件告警，说ES占用CPU异常（自己整的docker监控，对自己部署的容器进行了监控与告警）。
于是到 Grafana 中查看，发现ES的CPU占用开始尖刺形而后长期过高，猜测是GC导致的。
在这里插入图片描述

登录服务器查看ES的GC日志，如下：频繁触发GC，可回收垃圾较少，且占用时间过高（5s）。

在这里插入图片描述

而正常应该是这种，偶尔一次young GC，年轻代每次回收约90%的垃圾
在这里插入图片描述
因为我服务器配置较低，只能给ES很少的资源，限制了其内存，当因为索引过多，内存达到上限后不断触发GC（可以看到基本每两个安全点都要触发一次GC），由于JVM认为他们是不能回收的，故每次基本不会回收东西，导致频繁触发，我这里使用的是ES默认CMS 垃圾回收器，CMS垃圾回收器在识别垃圾时，会扫描JVM堆空间中的对象，这部分会占用较多CPU。
既然找到了根本原因（频繁触发GC），那就要对症下药，把无用垃圾的干掉，将CPU占用降下去。