记一次CDH事故

前段时间太忙,很久没有写日志,刚刚好碰到一次事故,虽然查询解决比较简单,还是记录下。
早上发现准生产环境大批作业报错,作业没有起起来,查了CDH集群,所有组件都崩了,再仔细查看,原来是因为master1节点日志写满了磁盘,所以集群停止了运作。。

  • 涉及Linux关于磁盘设备挂载的知识 :
  • /dev目录
  • /dev/mapper 进行设备映射
  • 关于cdh集群日志的存放路径:
  • /var/log 关于各个组件的日志
  • /var/lib 下关于cloudera manager进程的日志

清理日志后集群自动回复正常,调起作业开始跑批,但是发现大批次作业依然是报错:hdfs file not found, 怀疑是cdh崩溃的时候impala catalog server 发生问题,所以界面上重启组件impala,再次调起作业跑批,作业正常运行。
反思
大数据的运维离不开linux平台,对于linux的了解仍然需要巩固。
平台的监控、运维进程很重要,这部分需要提上日程。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值