【Hadoop】数据存储----HDFS_hdfs存储键值对数据，2024年最新非科班程序员金三银四求职经历

荀经纶

于 2024-04-18 18:23:36 发布

阅读量441

点赞数 6

分类专栏： 2024年程序员学习文章标签： hadoop hdfs 大数据

本文链接：https://blog.csdn.net/2301_76224593/article/details/137931956

版权

62 篇文章 0 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新软件测试全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上软件测试知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024b （备注软件测试）

1.hdfs设计思路和实现目标： 1.硬件错误检测和快速恢复；2.注重批量处理而非用户交互处理，注重高吞吐率；3.大规模数据集；4.简单一致性模型；5移动计算比移动数据更加划算

2。hdfs体系机构：

主从结构。主机主要负责客户端访问元数据的要求，以及存储块信息。从机主要负责对主机进行实时备份，同时定期将用户操作记录以及文件记录归并到块存储设备，并将其回写到主机。当主机失效时，从机接管主机所有的工作

namenode 和 datanode ；

namenode用来进行文件的命名空间的管理—元数据； namenode使用事务日志来记录hdfs的元数据的变化，使用映像文件存储文件系统的命名空间，包含文件的映射、文件的属性等。其中hdfs还专门设置了secondary namenode节点，用它来辅助namenode处理映像文件和事务日志。

datanode文件实际存储的内存地址；

（该图借鉴网上用图）

.一个HDFS集群是由一个NameNode和若干个DataNode组成.

NameNode是主控制服务器，负责管理HDFS文件系统的命名空间，记录文件数据库在每个DataNode节点上的位置和副本信息，协调客户端(Client)对文件的访问/操作，以及记录命名空间内的改动或命名空间本身属性的改变。

DataNode是数据存储节点，负责自身所在物理节点上的存储管理。HDFS中文件存储是按块(Block)存储的，默认大小是64MB。一个集群只有一个namenode，一个机柜存储多个datanode，一个datanode含有多个block。

客户端操作数据，只通过NameNode获取DataNode节点的物理位置，对于写/读数据的具体操作，NameNode是不会参与的，全部由DataNode负责。

由于HDFS中只有一个NameNode节点，所有存在单点问题，即如果改NameNode节点宕机，那么HDFS就会出现问题，数据可能丢失。解决办法是启动一个SecondaryNameNode或者将NameNode数据写出到其它远程文件系统中。

副本日志

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注软件测试）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
JThLrVmM-1713435799082)]

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

关注