2016年01月_Android路上的人

原创 NameNode处理上报block块逻辑分析

前言在hadoop集群中,一个datanode执行启动操作后,会在namenode中进行节点的注册,然后namenode会与这个新注册的datanode通过心跳的形式,进行信息的传输,一方面datanode将会汇报自身的block块的情况,另一方面然后namenode接受到这些块后,进行一段分析,然后返回datanode相应的反馈命令.同时这个操作也用来判断,节点是否已经是dead状态了.但是这个

2016-01-29 14:43:33 9488 5

原创 Hadoop中止下线操作后大量剩余复制块的解决方案

前言如果说你是一名hadoop集群的日常维护者,那么你肯定经历过很多的节点上下线工作.例如,随着业务规模的高速扩张,集群的资源渐渐的不够使用的时候,一般正常的做法是通过增加机器来达到线性扩展的效果.当然,当这些机器在使用的过程中,出现了机器老化而引发的各自问题的时候,比如磁盘坏了,又比如某些机器网络偶尔连接不上了等,这个时候,就要把这些机器从集群中挪掉,切忌不能图一时的小利益,将这些机器留在集群中

2016-01-24 15:36:10 13481

原创 DataNode引用计数磁盘选择策略

前言在HDFS中,所有的数据都是存在各个DataNode上的.而这些DataNode上的数据都是存放于节点机器上的各个目录中的,而一般每个目录我们会对应到1个独立的盘,以便我们把机器的存储空间基本用上.这么多的节点,这么多块盘,HDFS在进行写操作时如何进行有效的磁盘选择呢,选择不当必然造成写性能下降,从而影响集群整体的性能.本文来讨论一下目前HDFS中存在的几个磁盘选择策略的特点和不足,然后针对

2016-01-17 15:55:13 5136

原创记一次DataNode慢启动问题

前言最近一段时间,由于机房需要搬迁调整,我们hadoop集群所受到的影响机器无疑是数量最多的,如何能最优的使机器在从1个机房搬到另1个机房之后,对集群的数据和上面跑的业务造成尽可能小的影响或者说几乎没有影响.这就是我们想到达到的目标.但是在实施这整个搬迁的过程中,还是发现了一些比较有意思的现象的,于是就有了如文章标题所描绘的现象,为什么说是"记一次"呢,因为这个现象并不是每次都发生,所以这件事看上

2016-01-13 10:27:52 33820 10

原创 DataNode迁移方案

DataNode迁移方案目标由于外界因素的影响,需要将原有dn所在节点的机器从A机房换到B机房,其中会涉及到主机名和IP的改变.最终的目标是迁移之后对集群不造成大影响, 服务依然可用,数据不发生丢失.相关知识因为在dn迁移的时候,必定会导致迁移节点停止心跳,如果超过心跳检查超时时间,此节点就会被任务是dead node,为了平衡副本数,会造成集群内大量的block块复制的现象,如果不想要在短时

2016-01-08 17:44:44 4669

原创 YARN批处理方式kill Applications解决方案

前言在使用hadoop集群的时候,所有的任务都是最终以Application的形式跑在集群中,不管你是自己写的MR程序亦或是你写的hive sql转化成的mr任务,最终都是以Application应用的身份在跑.这些Application跑完之后,这些信息在jobHistory中就可以看了,可以说hadoop在这方面做得真的非常完整.但是完善归完善.但是jobHistory可以说是一种"事后分析"

2016-01-05 09:08:14 19120

走在前往架构师的路上

原创 NameNode处理上报block块逻辑分析

原创 Hadoop中止下线操作后大量剩余复制块的解决方案

原创 DataNode引用计数磁盘选择策略

原创记一次DataNode慢启动问题

原创 DataNode迁移方案

原创 YARN批处理方式kill Applications解决方案

空空如也

空空如也

原创 NameNode处理上报block块逻辑分析

原创 Hadoop中止下线操作后大量剩余复制块的解决方案

原创 DataNode引用计数磁盘选择策略

原创 记一次DataNode慢启动问题

原创 DataNode迁移方案

原创 YARN批处理方式kill Applications解决方案

空空如也

空空如也

原创记一次DataNode慢启动问题