HBase实战

本文详细介绍了HBase的逻辑视图、特点、相关术语、读写操作流程,以及常见命令。阐述了HBase在海量数据存储中的优势,如预分区、RowKey设计原则,并探讨了HBase的适用场景和优化策略。此外,通过MapReduce示例展示了HBase的读写操作,以及如何利用MapReduce对HBase数据进行分析。
摘要由CSDN通过智能技术生成

1.     HBase海量数据库(key-value)

HBase逻辑视图


行键+时间戳+列族=key

字节码=value

修改=新增;删除=标记(合并时删除)

HBase的特点


HBase相关术语:

元素由行健+列族+时间戳唯一确定

HLOG保存在HDFS中,因此自身具有一定的容错能力;一个RegionServer只有一个HLog

HBase中特殊的表-ROOT(只有一个Region),.META.

当采取写操作时

1)    Zookeeper->-ROOT表->.META.表->TableRegion

2)    写入MemStore中,当MemStore达到某个阈值时,通过flushcache写入StoreFile中,一个冲写产生一个StoreFile

3)    当StoreFile的数量达到某个阈值时,多个StoreFile合并成一个大的StoreFile

4)    当StoreFile的大小达到某个阈值时会分成两个Region

当采取读操作时会优先读取MemStore中的数据,若找不到则去StoreFile中找

同一个列簇的数据被保存在同一个文件夹下的多个文件中,一个Region至少包括一行数据



一张HBase表根据RowKey划分成多个Region,一个Region又包括多个Store(列簇),一个Store又包括多个StoreFile(不同版本数据)

常见HBase命令:

1)  status 查看HBase状态

2)  version 查看HBase版本

3)  create ‘member’,’member_id’,’address’,’info’创建一个’member’表,且具有’member_id’,’address’,’info’三个列族

4)  list 列举所有表

5)  desc ‘member’ 获得表详情

6)  disable ‘member’ 关闭表

7)  alter ‘member’,{NAME=>’member_id’,METHOD=>’delete’}删除表中的member_id列族

8)  enable ‘member’ 打开表

9)  exits ‘member’  表是否存在

10)   is_enabled‘member’ 表是否开启

11)  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值