位置:org.apache.hadoop.hbase.regionserver
说明:该类是HBase集群中RegionServer启动时的入口类,因此被我作为了HBase源代码阅读的起点。
HasThrea基类
位置:org.apache.hadoop.hbase.util
该类是Runnable接口的实现类。持有了Thread类实例,并将Thread实例的通用方法委托给了该类的实例。
这个类的存在是为了解决一些JVM中发现的bug。
RegionServerServices接口
该接口规定了HRegionServer应该提供的服务
LastSequenceId接口
和刷盘有关的一个简单接口,主要是记录了上次被刷盘数据的序列id。
实例变量——regionsInTransitionInRS
该实例变量记录region的状态,是一个ConcurrentSkipListMap实例。如果打开region的动作正在执行,则其value为true;如果关闭region的动作正在执行,则其value为false。
实例变量——cacheFlusher
该实例变量持有了对RegionServer中的MemStore进行刷盘的所有必要信息,详见MemStore源代码解读。
实例变量——hMemManager
该实例变量对堆内存进行管理。
实例变量——clusterConnection
待整理
实例变量——metaTableLocator
该实例主要的作用是操作Zookeeper集群中hbase:meta节点的内容
实例变量——tableDescriptors
该实例的主要作用是从文件系统获取表的schema
实例变量——compactSplitThread
实例变量——onlineRegions
该变量持有了regionserver当前持有的所有region的信息,是一个ConcurrentHashMap类型,其key值为region名称
实例变量——regionFavoredNodesMap
对HBase的优化信息。记录了每个region对应的DataNode位置信息,根据该信息我们可以以更小的网络带宽消耗存储和读取数据。
实例变量——recoveringRegions
记录了当前处于恢复状态的region的集合,意味着这些region当前可以接受写请求,当不能响应读请求。
实例变量——leases
位置:org.apache.hadoop.hbase.regionserver
说明:RegionServer中有一些类需要通过发送心跳来追踪外部客户端的状态。因为外部客户端持有了服务端类的资源。当外部客户端失效后这些被持有的资源就会被释放掉。
Leases类是该模式的通用类,一个Leases的实例可以创建一个线程来做这些事情,当不需要这些类的时候,我们可以通过调用close方法来清除线程。
实例变量——service
位置:org.apache.hadoop.hbase.executor
说明:该实例为ExecutorService类型,是一个通用的执行器服务。在RegionServer中,程序会调用该类的实例对象的startExecutorService方法,根据传入的ExecutorType的不同,将会初始化不同类型的线程池对象。在后续使用中,对于不同的执行类型,该服务实例会选择不同的线程池对象提交。
this.service.startExecutorService(ExecutorType.RS_OPEN_REGION,
conf.getInt("hbase.regionserver.executor.openregion.threads", 3));
实例变量——fs
位置:org.apache.hadoop.hbase.fs
说明:该类是对Hadoop的FileSystem的一层封装,用来从文件系统中读取和写入数据
实例变量——infoServer
该变量对应了HBase的webui界面
实例变量——pauseMonitor
该变量是一个RegionServer暂停监控器,对server的暂停时间进行计算并根据计算结果判断暂停市场是否过久
后记
去年11月开始,按照领导的要求,我开始对HBase源代码进行分析阅读,并在代码中添加日志编译并运行在集群中对HBase运行过程中的问题分析提供便利。
春节过后发现自己对当时的阅读分析有一定印象,但是较为模糊,所以呢,在这里记录一下,也算是自己的工作总结吧。
本篇文章主要对HRegionServer类的主要实例变量进行了罗列,作为一个工作列表。后续对每个待整理实例变量进行深入阅读后会将其阅读笔记另开博客进行记录,并在本篇更新阅读笔记链接。这也可以作为HRegionServer源代码阅读笔记的目录存在。