自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 YARN 的 ResourceManager 失败后,如何恢复任务?

摘要:ResourceManager故障恢复流程分为四个阶段:1)故障检测与切换,通过ZKFC监控并选举新ActiveRM;2)新ActiveRM从持久化存储重建集群状态;3)与NodeManager重新同步,获取实时容器状态;4)恢复应用程序,根据状态对比结果决定是否重启AM或继续运行。该机制确保集群在RM故障时仍能保持可用性,但AM重启可能导致部分任务重新执行。(149字)

2025-09-16 20:02:45 116

原创 什么是 hdfs 的纠删码技术ErasureCoding?

HDFS纠删码是一种以计算换存储的数据保护技术,将数据编码为多个数据单元和校验单元,允许部分单元丢失后仍可恢复。相比传统3副本机制,纠删码显著降低存储成本(1TB数据只需约1.4TB空间),但恢复速度较慢。其工作流程包括:写入时先暂存副本,后台编码分发;读取时直接解码数据单元,故障时需重建丢失单元。纠删码与多副本互补,共同构建高性价比的分层存储系统,在保证可靠性的同时优化存储效率。

2025-09-16 19:54:10 227

原创 zookeeper的选举机制

Zookeeper采用快速领导者选举(FLE)算法实现集群Leader选举。选举基于Zxid(事务ID)和myid(服务器ID)两个关键信息,优先选择Zxid最大的节点,Zxid相同时选择myid较大的节点。选举过程分为投票发起、广播选票、选票比较和Leader确认四个阶段,通过TCP连接快速收敛投票结果。当选票超过半数节点统一时选举结束,新Leader负责数据同步和写请求处理。该算法确保了集群在Leader故障时能快速恢复服务,保证数据一致性。

2025-09-16 19:41:15 558

原创 yarn的三种调度器

摘要:三种调度器各有特点:FIFO按任务提交顺序执行,简单但易被大任务阻塞;容量调度器通过多通道避免阻塞,但需预留资源且大任务执行较慢;公平调度器动态平衡资源,保证任务公平共享但可能延长前期任务完成时间。FIFO适合简单场景,容量调度器适用于多任务混合,公平调度器则注重资源公平分配。

2025-09-15 19:51:36 88

原创 MapReduce的工作原理

摘要:MapTask处理数据时,通过FileInputFormat读取分片数据,每行生成(K,V)对(K为偏移量,V为行数据)。调用map方法处理后,数据经OutputCollector写入环形缓冲区(默认100M)。当缓冲区达80%时触发溢写,先分区(默认HashPartitioner)再排序(默认按key字典序快排)。溢写生成多个文件后,MapTask完成分片读取后合并文件并进行归并排序。该过程称为shuffle,涉及数据从map到reduce的传输。

2025-09-15 19:35:02 143

原创 inode与block详解

注:inode中并不包括文件名,其实文件名是存放在目录当中的,linux系统中一切皆文件,因此目录也是一种文件即查看目录中的文件,cd转目录后通过ls列目录里可以查看文件名,而我们每个inode都有一个号码,系统用inode号码识别不同的文件,系统内部不使用文件名,而使用inode号码来识别文件。用户通过文件名打开文件时,系统内部的过程(重要) 系统找到这个文件名对应的inode号码 通过inode号码,获取inode获取信息 根据inode信息,找到文件数据所在的block,读出数据。

2025-09-01 19:55:46 273

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除