HBASE 分布式数据库 CRUD
集群存储 ==>数据量大 高并发
MYSQL 存储数据 CRUD
单节点 ==>数据量有限 并发有限
简介:
hbase是一个 列式存储的分布式数据库
1mysql 存储结构化数据 当数据的条数达到亿级别 查询 存储遇到瓶颈
2mysql 并发量比较打 单台机器的处理能力有限 导致效率低下
HBASE 分布式的数据库 分布式储存 横向扩展(存储 运算)
数据可以是结构化的 也可以是非结构化的
1行和行的字段可以不一致
2行的属性个数没有限制 百万列 一列
3表储存的数据 很大 行数很多 列数很多
4表的数据可能存储在不同的机器上 表可能被切割 储存在不同的机器上(region)
tb_user_row001_uid: u001
tb_user_row001_name: xiaohu
tb_user_row001_uid: M
tb_user_row001_uid: DS
tb_user_row001_uid: u001
tb_user_row001_name: xiaohu
tb_user_row001_uid: M
tb_user_row001_uid: DS
hbase基础框架
通过ZOOKEEPER进行注册 选出master
master regionserver
数据切分到不同的regionserver中进行操作
regionserver连接到HDFS客户端,
数据块在HDFS虚拟目录中tb_a_region(0,1,2)
连接到HDFS储存数据(数据真正存储的位置)
hbase稀疏性