Hbase架构设计和源码-源码第二篇

Hbase 版本 2.x

HMaster启动流程

在这里插入图片描述
1
在这里插入图片描述

初始化父类HRegionServer
	创建启动RPCServer,ZKWatcher

2
在这里插入图片描述

初始化activeMasterManager

3
在这里插入图片描述

HMaster线程run()方法
1 启动hmaster web服务
2 启动前面初始化的activeMasterManager
	竞争active
		1 所有hmaster在zk内同一父节点下创建一个代表自己的临时backup znode节点 (备份节点)
		2 阻塞。当没有active存在时,则一直while循环线程sleep等待 (阻塞为了让大家抢active)
		3 分布式锁方式抢active
			多个hmaster同时在zk尝试创建代表active身份的临时znode节点,创建成功的hmaster判定为active
		4 如果抢到active:active hmaster删除之前创建代表自己的临时backup znode节点,其他hmaster不删除
		4 如果没抢到active:backup hmaster在zk中监控active hmaster的znode节点。如active不在了则循环竞争
	完成hmaster各种组件初始化
		初始化ChunkCreator:
			MemStoreLAb主要解决memstoreFlush内存碎片化导致的gc
			memstore底层是一个链表,每个节点时一个key-value对象
			每当插入一条数据,一个key-value就会在HRegionServer内存中申请一块内存存储,插入到链表中。
			但是链表中插入的多个key-value数据物理内存中不连续 -> 1 产生内存碎片 2 大量key-value提升老年代
			
			优化方案:hbase1.x版本时插入一个cell则申请一个cell的内存
			hbase 2.x之后优化为一次性申请2mb连续的内存,变成一个对象放入链表。ChunkCreator就是创建chunk的对象实例
			key-value数据写入chunk中,当chunk写满则再申请一个chunk入链表,链表为ConcurrentSkipListMap,跳表查询快
			Chunk可以回收再使用,再加入ChunkPool这就一定程度上降低了Chunk对象申请的频率,有利于Young GC

			https://blog.51cto.com/u_15060465/2676745 更详细的文章介绍
		初始化ProcedureExecutor
			用于将来封装用户put,get等请求放入线程池执行
		初始化AssignmentManager
			用于帮助HMaster分配region给哪些regionServer管理
		如果集群第一次启动,则初始化meta表
		初始化等等很多组件(50多个)和启动各种服务线程
		上线meta表,加载元数据到内存

在这里插入图片描述

HRegionServer启动流程

HRegionServer 构造方法
HRegionServer 线程run()
	初始化
		初始化和zk连接,zk hbase/rs路径下创建当前regionServer信息的znode节点
		初始化和Hmaster连接
		创建Netty RPC客户端
	HRegionServer启动后,向master汇报
	处理master返回的汇报结果
	定期心跳

PUT流程

代码 table.put(new Put())

基本流程
1 客户端请求zk拿到meta表在哪个region server
2 发请求给region server扫描meta表信息,确定要插入的数据rowkey在哪个用户表的region server1和所在region server1信息
3 发请求给region server1扫描用户表信息,确定在哪个region server2
4 发送请求,region server2执行插入 
	WAL记录操作日志
	写入数据到memstore
	判断是否flush
		再次判断是否compact
		判断是否split

详细PUT写内存流程
checkResources()  资源检查
	如果时meta信息表则不处理直接return
	否之,如果堆内内存+堆外内存 > 设定阈值 (flushSize 默认128mb * mult 默认4),则阻塞flush溢写
dataBatchMutate(put) 插入数据
	拿到插入批次下所有rowkey对应的行级锁(hbase有行级事务)
	构建并顺序追加写入WAL日志
	将获得行级锁的数据写入memstore内存
		数据根据列簇拆分
		写入内存ConcurrentSkipListMap delegatee对象
requestFlushIfNeeded() put操作完成后,也需要判断是否mem flush
	1 每次刷写磁盘都会先添加布隆索引后再刷写
	2 Hbase底层都是存储的二进制字节数据,需要将内存数据encode充当写出动作
	3 将最小粒度的ceil对象(根据前文key-value数据结构klen/vlen等依次逐步的)写入HFile文件

备注:key-value大小不能超过默认参数10mb
PUT和GET底层都是rpcCall()方法调用,使用probubuf序列化并提交RPC请求
PUT rpc请求时发送给region server,而不是master,前面提过hmaster宕机集群依然可以运行
2.x 版本后 meta表的region有副本概念

GET流程

代码 table.get(new Get())

如果client之前已经读取过,则client缓存已经保存了数据所在region信息,直接跳过1 2 3步骤
同上put 1 2 3
4 发送请求,请求region server2
	1 查询 blockcache (读缓存)
	2 布隆过滤器判断
		如判断rowkey不存在,则不再扫描HFile。存在则扫描

Region Server定位分析

PUT/GET 
第二步 locateMeta(tablename,useCache,replicaId) 查zk的meta表信息和位置
第三步 locateRegionInMeta(tablename,row,useCache,retry,replicaId) 查meta表所在的region server用户表信息
	定位连接region server retry超过15次则报错

Flush memstore入HFile

requestFlush()
	flushRegion(fqe)

Split

split()

Compact

requestCompact()

竞品比较
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我爱肉肉

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值