![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
IT运维
分享运维中遇到的问题,共同成长
xiangbatianxia
这个作者很懒,什么都没留下…
展开
-
记录一次prometheus占用大量内存故障处理
prometheus内存过大原创 2022-10-04 22:18:52 · 3939 阅读 · 0 评论 -
记一次elasticsearch7.x运行时字段使用不当引起的查询缓慢事故
elasticsearch运行时字段使用注意原创 2022-06-01 14:50:41 · 322 阅读 · 0 评论 -
elasticsearch7.16版本数据冷热分层迁移失败总结
elasticsearch7.x 数据冷热分层原创 2022-04-30 23:14:52 · 875 阅读 · 1 评论 -
celery定时任务无法自动执行
celery原创 2022-03-12 17:34:12 · 3053 阅读 · 2 评论 -
ELK7.x版本+kafka容器化部署(多主机)
1、场景:三台主机,172.31.1.14 部署 logstash+kafka;172.31.1.15部署es节点1(数据节点)+kabana;172.31.1.30 部署es节点2(数据节点)+es节点3(非数据节点)2、容器化方式:docker-compose 单机编排3、坑点:1、容器之间需要打通网络,否则es集群无法建立;2、配置文件外挂,经常调整的参数要写入配置文件,固定的配置可以写入docker-compose.yml的环境变量里,否认后期改动配置,需要重建容器影响比较大。3、es集群至原创 2021-12-08 11:44:42 · 489 阅读 · 0 评论 -
filebeat+logstash顺序存储日志
filebeat+logstash顺序存储日志老问题,之前没有上FELK全套组件,只通过filebeat+logstash将java应用日志存储到日志服务器,运维和研发同事通过登录日志服务器,用shell命令进行日志查看,人用的多后,发现日志收集过来后,有些应用的日志会乱序,即时间没有按顺序输出,后一秒的日志放在了前面,这样很影响研发进行排查问题,啰嗦的话不多说,直接解决问题:经过排查是logstash线程数的问题,因为多线程本身就是无序的,这样日志落地后,就会出现顺序错误的情况,修改配置:pipel原创 2021-09-06 17:47:01 · 797 阅读 · 1 评论 -
一次大批量java应用程序存活zabbix告警
晚上突然收到zabbix告警,告警消息刷刷的过来,打开企业微信一看,几乎全部是java应用程序存活的告警,首先先梳理下环境:当前告警涉及的应用范围是所有通过一个zabbix-proxy代理节点,主机监控、应用监控都是通过该代理节点,上报为zabbix-server端,同事第一时间重启了zabbix-proxy的服务,但并没有效果,仔细观察,都是jvm 不可达的告警【其实到这就应该想到那个zabbix组件的问题了】,主机存活正常,如果是zabbix-proxy节点的问题,那应该相关的主机和应用监控均受影响原创 2021-08-04 17:21:44 · 153 阅读 · 0 评论