2.5 HBase DDL&DML&DQL流程

公共流程

当客户端访问一个表的时候,首先去询问Zookepper
Zookepper会告诉客户端-root-Region所在的RegionServer
→ 通过root 找到 meta 所在ResionServer
→ 通过meta 查找结果


公共表 root

它是一张普通的表,但是由HBase自己维护
它的机构和meta一模一样,但是它只维护meta表的切分信息
理论上-root-表不会被切分
(大数据量数据 → meta(只记录位置) → root(只记录meta的位置)root已经相当小了 不需要切分 )
RowKeyInfo:Info:Rs
meta-s2013-tss:201300 e:201399 scorers02
meta-t2013-tss:201300 e:201399 scorers01

解释信息:


RowKey:
meta表 s学生(student) ts(时间戳)
Info: (列族)
s: 和 e: (起止key范围) score(分数列族)
Info:Rs (ResionServer)


公共表 meta

它是一张普通表,但是由HBase自己维护
RowKeyInfo:Info:Rs
s-201300-tss:201300 e:201399 scorers02
s-201500-tss:201500 e:201599 scorers04
s-201400-tss:201400 e:201499 scorers06
s-201700-tss:201700 e:201799 scorers05
t-201300-tss:201300 e:201399 scorers01

解释信息:


RowKey:
s学生(student) ts(时间戳)
Info: (列族)
s: 和 e: (起止key范围) score(分数列族)
Info:Rs (ResionServer)

meta表数据量多的时候也会被切分成多个Region,位于多个RegionServer上
当我们询问Zookepper的时候,也会给我们多个数据让我们去找结果


DDL – 数据定义语言 Create

不走公共流程
联系Master → 找到不忙碌的ResionServer 
发送指令创建 → 最终将文件保存在
zookeeper上


DQL – 数据查询语言 Select

首先客户端和RegionServer建立连接
查找对应的Region,然后查找对应的列族(Store)
查找memstore中是否存在对应的数据,然后找到直接返回
如果找不到去RegionServer(BlockCache)
开始去查找strorefile,因为storefile中的数据是有序的,所以查找速度比较快
如果查找到数据就将数据返回到客户端,客户端会保留数据的缓存信息



DML – 数据操纵语言 Insert Delete Update

首先客户端和RegionServer建立连接
然后将DML要做的操作写入到日志wal-log
然后将数据的修改更新到memstore中,然后本次操作结束
当memstore数据写到阈值之后,创建一个新的memstore,所有新的数据修改更新到新的memstore中
旧的memstore写成一个独立的storefile,存放到hdfs
如果store中的storefile数量达到阈值,开始合并storefile
    minor:少量
    major:完全

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值