DataNode启动流程

DataNode启动可以分为两个部分,创建DataNode对象和启动DataNode节点。

DataNode.main()说起:

1main(args)àsecureMain(args,null),在该函数内部:

调用StringUtils.startupShutdownMessage()方法打印启动或停止参数信息;

调用createDatanode(args…)创建DataNode对象e;

若创建成功,调用e.join()加入集群。

 

2、紧接着,我们来看createDatanode方法,在该方法内部:

1)instantiateDataNode()方法,用于初始化DataNode成员变量;

2)runDatanodeDaemon()方法,daemon方式运行DataNode

 

3、在instantiateDataNode方法内部,主要进行了如下操作:

1)判断conf参数是否为空,为空,则创建HdfsConfiguration对象;

2)调用GenericOptionsParse解析输入参数;

3)判断输入参数是否符合创建条件,不符合,直接返回;否则,

a、获取配置文件hdfs-site.xmldfs.datanode.data.dir参数所对应的属性信息集合;

b、调用makeInstance(…)方法。

 

4、在makeInstance方法内部,

1)创建本地文件系统localFS,根据输入参数conf;

2)创建针对dfs.datanode.data.dir.perm属性对应的信息操作权限对象FSPermission;

3)创建DataNode.DataNodeDiskChecker对象,调用checkStorageLocations(),该方法主要进行校验文件夹是否在本地文件系统中存在,若存在,则检验文件所属用户的权限,将符合条件的目录集合返回;

4)调用DistributeMetricsSystem.initialize();

5)至少有一个目录存在,且满足权限;

6)调用DataNode的构造函数,创建DataNode实例。


6、在DataNode构造函数内部

进行了一些属性信息(变量)的赋值操作;

最主要的在startDataNode方法内部


startDataNode方法内部,

成员变量赋值及实例化对象;

registerMXBean()方法用来注册Mbean信息的;

initDataXceiver()方法实例化DataXceiverServer,该对象主要是用来接收客户端或者其他Datanode的数据接收或者发送请求;

startInfoServer()方法启动Datanodeweb服务器;

pauseMonitor使用来监控JVM是否有停顿的;

initIpcServer()用来启动DataNode上的rpc服务,主要包括两个服务:ClientDatanodeProtocolPBInterDatanodeProtocolPB;

BlockPoolManager对象的实例化,用来支撑hadoop federation特性,该对象的实例调用refreshNamenodes(conf)函数,在该函数内部:

a、首先,获取集群dfs.nameservices所对应的namenode节点的主机地址信息newAddressMap,keydfs.nameservices对应的属性值,value为以dfs.ha.namenodes.${ dfs.nameservices}key,值为namenode节点地址信息的map;

如:keyhdpha , value:<<n1,master-active:8020>,<n2,master-standby:8020>>

b、然后,调用doRefreshNamenodes()函数,在函数内部调用createBPOS()函数创建BPOfferService对象,进而创建BPServiceActor对象;

c、调用startAll()函数,进而调用BPOfferService对象的start()方法,调用BPServiceActor对象的start方法, BPServiceActor是一个实现Runnable接口的线程;

d、调用BPServiceActor对象的run方法,在方法内部调用connectToNNAndHandshake();

e、在方法内部,是与NameNode节点进行握手并注册的过程,

A1、首先调用DataNode对象的connectToNN()创建DatanodeProtocolClientSideTranslatorPB对象;

A2、然后调用BPServiceActor对象的retrieveNamespaceInfo函数创建NamespaceInfo对象,在对应的函数内部调用了DatanodeProtocolClientSideTranslatorPB对象的versionRequest()请求连接(RPC调用)Namenode节点的信息,该方法返回一个NamespaceInfo对象,这个类主要包含了整个HDFS的版本信息

A3、紧接着调用BPOfferService对象的verifyAndSetNamespaceInfo(nsInfo)进行校验,主要进行数据块的初始化工作,其内部调用了DataNodeinitBlockPool方法

A4、最后调用BPServiceActor对象的register()进行Datanode节点注册

关注:DatanodeRegistration这个类包含了所有NameNode用于与DataNode的通信过程中识别和确认DataNode节点的信息,DataNode通过RPC调用NameNode方法的时候,会传递这些信息。

f、上报数据块 , Datanode 节点注册好以后 , 调用 BPServiceActor 对象的 offerService() 方法 , 在方法内部 ,DataNode 节点根据心跳时间间隔循环的发送心跳信息 , 上报最近接收到的数据块信息 , 上报所有的数据块信息


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值