自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

胡俊辉的博客

JAVA和大数据学习交流

  • 博客(4)
  • 收藏
  • 关注

原创 Hadoop-HDFS RBF

在前文中提到,HDFS 联邦架构使得HDFS 的NameNode 具有可伸缩性,针对多个NameNode,用户该如何去使用这些NameNode 呢?常见的解决方案是针对联邦中的HDFS 子集群提供 联合视图 ViewFs。

2023-04-14 17:48:26 885 1

原创 Hadoop-HDFS联邦

在单NameNode 的架构中,一个NameNode 管理一个Namespace,NameNode 管理的元数据会全部加载到其内存中,而单台NameNode所在的节点的内存是有上限的,因此也会造成NameNode 的存储瓶颈;再者,所有的HDFS客户端都操作同一NameNode,文件系统的吞吐量也有上限。

2023-04-13 20:49:57 469 1

原创 hadoop源码解析-HDFS通讯协议(下- DataNodeProtocol、InterDatanodeProtocol、NamenodeProtocol和流式接口)

远端的 Receiver接受到请求,会反序列化请求,然后调用代码执行读取操作。DataNode 在注册成功后,会将自己所有的块信息上报,方法含有3个参数,包含一个DataNode 标识,块池ID 和数据块列表,NameNode接受到消息时,会将上报的块信息与DataNode建立其对应的关联关系,同时在响应结果中携带相关指令,通知节点进行重新注册、发送心跳、备份或者删除DataNode 本地磁盘上的数据块,块上报在启动就会执行一次,后续会按照参数,按照一定的时间间隔进行数据上报。

2023-04-13 15:19:02 460 2

原创 hadoop源码解析-HDFS通讯协议(上- ClientProtocol 和 ClientDataNodeProtocol)

NameNode 的内存中除了保存文件系统的namespace外,还保存了文件系统中所有的数据块与DataNode节点的对应关系,因此,NameNode 的内存将会成为HDFS的横向扩展的瓶颈,而当数据块过多,也会引起NameNode频繁的GC,影响系统的稳定性。当客户端读取一个HDFS文件时,需要获取这个文件对应的所有数据块的长度,用于简历数据块的输入流,然后进行数据读取,但是NameNode 的元数据中文件最后一个数据块的长度可能与实际的不一致,所以需要调用这个方法获取真实长度。

2023-04-12 17:22:10 2025

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除