Hadoop节点"慢磁盘"监控

Hadoop集群中慢磁盘的监控与处理

最新推荐文章于 2024-07-24 08:23:26 发布

原创

最新推荐文章于 2024-07-24 08:23:26 发布 · 1.6w 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#监控 #hadoop #磁盘

本文介绍了如何发现和监控Hadoop集群中的慢磁盘问题，包括通过心跳未联系次数、Ganglia监控和自定义脚本来定位慢磁盘。作者分享了在Hadoop层面对每个磁盘写操作时间进行监控的方法，并提供了实现该功能的开源patch。一旦发现慢磁盘，建议立即下线并联系运维部门处理。

前言

最近在工作中解决了一个慢磁盘的问题,个人感觉整个发现-分析-解决的过程还是非常有意思并且很有意义的.而且磁盘监控在目前的Hadoop中还是没有做的很全的,大多数都是对Datanode,可以说这是1个盲区.其实想一想,hadoop自身不做这方面的监控也合理,因为像这种问题基本上是属于硬件问题,本不应该在软件层面对其进行监控,没有这么大的必要.但是后来我们想了想,如果通过软件层面的监控手段发现机器硬件上的问题也不错,至少能发现问题,何乐而不为呢.下面进入文章的正题.

慢磁盘

在这里我姑且用这个名词来解释这个现象,用专业点的英文术语说应该是slow-writed disk,译为写入操作很慢的磁盘,写操作主要包括创建文件,目录,写文件这些操作.而慢磁盘的理解就是进行这些写操作耗时远远超出平均值时间的磁盘.我们在最近就碰到了这样的场景,其他正常的盘基本上创建1个Test目录,只需1/10或者快的1/100秒左右的时间,而我惊奇的发现有块盘竟然花了5分钟左右,而且更奇怪的是,有的时候会出现有的时候又不会出现这样的现象.一旦出现了慢磁盘,将会严重拖慢这个节点的整体运行效率,继而让此节点成为集群中的慢节点,最后影响整个集群.那么问题来了,既然慢磁盘这么重要,我们怎么准确定位到哪台机器的哪块磁盘有问题的,那么多个节点,每个节点上又有那么多块盘.

慢磁盘的发现

下面教大家几个方法:

1.通过心跳未联系次数.一般如果出现慢磁盘现象,会影响到datanode与namenode的心跳,这个值会变得很大.

2.通过ganglia对datanode写操作相关的监控,这个是传统的方式.

对比几个特殊的节点观察时间有没有特别长的.

当然以上是确定可疑慢磁盘所在节点,假设异常节点已经发现,下面是怎么发现上面的慢磁盘,这个方法不用想的那么复杂,这里提供最简单的方法,写1个脚本,在所有的磁盘上执行

time mkdir test
rm -r -f test

观察哪个磁盘所花的时间最长就可以了.当然你想用Linux工具专门的检查磁盘读写性能的命令,当然最好了.

慢磁盘监控

上面提供的方法在使用性和准确性方面还是存在许多偏差的,尤其是在寻找慢磁盘的方法上,因此最权威的方法还是在hadoop层面对每个磁盘进行写操作的时间进行监控,这无疑是最准的,所以我们要加自定义的M

最低0.47元/天解锁文章

8 条评论

Uper2019 2023.05.25
3.x 版本官方推出了dfs.datanode.fileio.profiling.sampling.percentage这种配置的方式将慢磁盘汇报到NameNode的metric中，想问下那个和作者的是不是相同原理，直接用就行呀

fatkun 2016.04.24
我们集群也遇到这个问题，有没有可能在程序中自动对磁盘检测和剔除？如果要剔除的话，我想到两个地方，分别是datanode和nodeManger。原本的代码中只有创建文件夹和权限的检查(DataNode.checkDiskError() 和 LocalDirsHandlerService.checkDirs())，但我担心如果加入检查慢磁盘，会导致多个磁盘同时不可用。
- Android路上的人回复fatkun 2016.04.24
  [reply]fatkun[/reply] 你可以统计每块盘的平均写入时间,如果发现某快盘写时间远远超出平均值,加入到坏盘中,这些逻辑可以同样加到DiskCheck线程中.DataNode可以容忍部分数量的坏盘,如果这个坏盘数量过多,DataNode进程会抛异常退出的.

qq_33338288 2015.12.14
很实用

windows7I 2015.12.10
好像很NB的样子

吴士龙 2015.12.08
如果慢磁盘已经发现了,怎么解决呢,最干脆的方法就是立即下线,不要在往这块盘上写数据了,并联系运维部门进行处理或者说你们自己内部想办法解决.但是还是那句话,像慢磁盘这样的偏硬件性的问题还是交给这方面专业的人去解决比较稳妥. 受教了！

qq_32825791 2015.12.07
怎么感觉这个是系统监控的层面是不是看看ganglia的硬盘wa就可以了? 楼主对hadoop源码很熟悉!动手能力也强赞美一个! 1024ss.com解决程序员难言之隐
- Android路上的人回复qq_32825791 2015.12.07
  [reply]qq_32825791[/reply] Ganglia上面的disk监控指标少而且没有具体针对到那块盘，无法完全解决问题。