Hadoop核心源码解析(轻量级)

读前需知

本文为作者学习Hadoop源码时的一些总结,可能会有理解错误的地方,学艺不精请谅解

HDFS上产源码解析

create创建过程

1.DN向NN发起创建请求,NN检查目录是否存在,是否可以覆盖,若满足,则addINode创建目录

2.NN处理DN的创建请求,创建输出流

3.启动线程DataStreamer,创建数据dataQueue队列后阻塞等待

write上传过程

1.向DataStreamer的队列里面写数据,写Chunk和CheckSum(512+4byte)写够127个生成packet后进入dataQueue队列并通知队列让其进行处理

2.队列获取第一个数据,建立管道(与NN通讯获取对应的块信息)即机架感知

3.建立管道,Socker请求发送packet,先发送,然后把数据在data队列移除,同时写入到ack队列

4.建立管道,Socker请求继续发送packet,把packet写入磁盘,然后发送到下一个节点(即为边写边发)

5.DN写完数据后应答Response,若是写成功就把ack队列首位移除掉,失败的话就把ack队列首位移到data队列首位(ack首位同样也会移除)

MapReduce源码解析

Job提交源码

1.创建提交Job的代理,判断是本地运行环境还是yarn集群运行环境

2.创建给集群提交数据的Stag路径,获取jobid,并创建Job路径,拷贝jar包到集群,

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值