CDH-TXKT-集群的监控和故障诊断

在这里插入图片描述

监控集群

有的公司只用cdh但没用cm。此时可以自己写监控程序或者用JMX和Metrics sinks(Nagios、Ganglia)
hadoop有内置的指标功能,可以对外提供接口

提供的功能

在这里插入图片描述

健康检查

配置检查,扳手的标志,suspense的意思是忽略

在这里插入图片描述

图表

指标都存在mysql中,

定制图表

提供了特有的tsquery语法
在这里插入图片描述

Events事件

不一定是发生了错误,只是操作人员感兴趣的行为。

Alerts

Audits

reports

企业版才有,可以把报告下载,可以定制
磁盘使用
yarn任务
impala任务

example

配置email报警

监控集群

内容

hadoop daemons

监控master节点的cpu使用

磁盘和磁盘的分区

swap交换分区

网络传输

hdfs健康状况

在这里插入图片描述

日志

内容

yarn日志可以设置是否聚合,如果聚合,会存到hdfs,否则只存在本地。
在这里插入图片描述
在这里插入图片描述

故障诊断

不好推断,只能一个个排查

常见问题

由错误配置引起的

35%的错误由错误配置

example1

报错

在这里插入图片描述

分析

在这里插入图片描述
排序内存小于java内存,排序内存按需分配,不需要设置很大

example2,没有足够的副本,比如节点3个,因子设为了4

在这里插入图片描述

example3,删除了数据后回收站找不到

没启用回收站
保留时间太短
在这里插入图片描述

总结

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值