在(一)中介绍了DataNode启动本机需要进行的一些检查和操作,但是作为分布式文件系统HDFS中的一员,启动时还需要启动各种网络服务。
this.registerMXBean(conf); // register the MXBean for DataNode
为DataNode注册MBean,具体MBean的介绍和使用见http://damies.iteye.com/blog/51788,这篇博客写的比较透彻,个人理解为HDFS的Web界面提供支持,欢迎拍砖。
获取一个端口并创建.dataXceiverServer线程,该线程负责处理来自HDFSClient和NameNode“指令”,该线程为一个守护线程,具体代码如下:
this.threadGroup = new ThreadGroup("dataXceiverServer");
this.dataXceiverServer = new Daemon(threadGroup,
new DataXceiverServer(ss, conf, this));
this.threadGroup.setDaemon(true); // auto destroy when empty
创建DataBlockScanner线程类的对象,创建HttpServer线程,并启动该线程,具体代码如下:
this.infoServer = (secureResources == null)
? new HttpServer("datanode", infoHost, tmpInfoPort, tmpInfoPort == 0,
conf, SecurityUtil.getAdminAcls(conf, DFSConfigKeys.DFS_ADMIN))
: new HttpServer("datanode", infoHost, tmpInfoPort, tmpInfoPort == 0,
conf, SecurityUtil.getAdminAcls(conf, DFSConfigKeys.DFS_ADMIN),
secureResources.getListener());
创建ipcServer线程,具体代码:
ipcServer = RPC.getServer(this, ipcAddr.getHostName(), ipcAddr.getPort(),
conf.getInt("dfs.datanode.handler.count", 3), false, conf,
blockTokenSecretManager);
到此startDataNode函数的代码分析结束。接下来DataNode线程启动,看一下DataNode的run方法。首先启动前面创建的dataXceiverServer线程和ipcServer线程,
dataXceiverServer.start();
ipcServer.start();
DataNode线程是一个循环执行的线程,不断的调用startDistributedUpgradeIfNeeded和offerService方法。startDistributedUpgradeIfNeeded暂时没有理解,下边分析下offerService主要的流程。
offerService主要的工作是向NameNode发送心跳信息(时间间隔3s)、发送新接收到的block信息(如果存储新接收到的block队列不为空,发送该消息)、发送全部block的信息(时间间隔较长,每一小时发一次)。其中发送心跳信息和发送全部block的信息,都会从NameNode获得cmd命令,DataNode通过 processCommand(cmd); 处理。之后启动前边提到的DataBlockScanner线程,具体执行的任务见另一篇博客。