今天集群告警,master节点根目录空间不足了
[root@master01 ~]# du -sh /home/app_rg/loaddata/
31G /home/app_rg/loaddata/
[root@master01 ~]# du -sh /var/lib/* | grep G
41G /var/lib/cloudera-host-monitor
7.8G /var/lib/cloudera-scm-eventserver
20G /var/lib/cloudera-scm-headlamp
25G /var/lib/cloudera-scm-navigator
49G /var/lib/cloudera-scm-server
57G /var/lib/cloudera-service-monitor
2.7G /var/lib/zookeeper
然后发现 /var/lib/cloudera-service-monitor 等几个目录的空间占用很大,但是这是CDH监控日志存放的目录,虽然可以清理 ts 目录里面的文件,但是会影响以后去查询集群历史运行情况(不建议生产环境这么搞,会被打死,不要问我怎么知道的):
1 删除日志
# rm -rf /var/lib/cloudera-host-monitor/ts*
#/rm -rf /var/lib/cloudera-service-monitor/ts*2 重启Service Monitor和Host Monitor
确认新的日志和元数据文件是否生成
# ls /var/lib/cloudera-service-monitor/ts/stream/partitions
# ls /var/lib/cloudera-service-monitor/ts/stream/partition_metadata/
后来想到可以切换日志目录,这样随着日志逐渐增加也不用子担心了,搞起来!
到CM上找到配置
各位亲,先停止服务,想改那个停那个,然后将老的数据文件mv到新的目录,我这里停了host monitor 和 service monitor
然后就可以进行目录转移了
mv /var/lib/clouder-hosts-monitor /!*这里不给你们看*!/diskb/clouder-monitor/
别忘了看看新目录权限的问题,不然服务起不来的,
别忘了看看新目录权限的问题,不然服务起不来的,
别忘了看看新目录权限的问题,不然服务起不来的,
重要的话说三遍,别问我为啥知道。
重启完成,空间使用率也下来了,以后也不用担心他的空间不够了,不过再大的磁盘也有空间满的时候,建议大家写个定时,日志保存一定时间就够了。
好了,该去跟领导解释那五十多条告警短信的事了,勿念 ε=(´ο`*)))唉