CDH集群安装完成后,用一段时间,就陆续会出现黄色的警告信息,此时如果选择忽略,则是治标不治本,笔者就遇到过这种情况,由于磁盘占满而导致zookeeper服务挂掉,导致整个集群崩溃,所以如果出现警告,发现问题、解决问题才是正确的路线。
一般情况下的告警,都是由于在安装过程中选择了默认的根目录下的磁盘目录,如果根目录磁盘占用量超过80%,则会出现告警,下面我们依次来解决。
(1)zookeeper
通过查看警告详情,四个告警全部为磁盘空间不足80%,所以需要对磁盘目录进行重新设置,除此之外,还可以对输出日志的等级进行设置。
假设我的容量大的磁盘为/home,则需要对/var下的原路径进行迁移,我的zookeeper服务安装在三台服务器上,所以对三台服务器需要同时操作
mkdir -p /home/var/log/zookeeper
chown -R /home/var/log/zookeeper
mkdir -p /home/var/log/zookeeper/version-2
chown -R zookeeper:zookeeper /home/var/log/zookeeper/version-2
mkdir -p /home/var/zookeeper_tmp
chown -R zookeeper:zookeeper /home/var/zookeeper_tmp
chown -R 700 /home/var/zookeeper_tmp
在cloudera-manager页面修改路径并重启
设置完成后重启服务,查看页面,已经恢复正常
(2)yarn
在安装集群的所有服务器上同时进行
mkdir -p /home/var/hadoop-yarn_tmp
chown -R yarn:yarn /home/var/hadoop-yarn_tmp
chown -R 700 /home/var/hadoop-yarn_tmp
####下面这块容易报错,需要注意,特别注意,在给赋权限的时候yarn-nm-recovery/后面的反斜杠####
mkdir -p /home/var/lib/hadoop-yarn/yarn-nm-recovery
cp -r /var/lib/hadoop-yarn/yarn-nm-recovery /home/var/lib/hadoop-yarn
chown -R yarn:yarn /home/var/lib/hadoop-yarn/yarn-nm-recovery/
chown -R 755 yarn:yarn /home/var/lib/hadoop-yarn/yarn-nm-recovery/
之后再管理页面搜索相关内容,进行修改。
修改完成后重启服务,查看页面,已经恢复正常
其它的服务是同样的原理,逐一进行改正,修改的时候需要注意用户权限、文件权限。