目录
1. HBase概念
HBase是基于Hadoop的非关系型数据库
- 特点
a.可以对海量数据进行随机,实时的读写操作
b.可以存储海量数据:数十亿行 X 数百万列
c.数据存储比较稀疏
d.数据类型比较单一
e.速度快
在数据量非常巨大的情况下,没有那么慢
2. 数据存储形式
- 表(table)
存储数据的基本单位 - 列族(columnFamily)
具有类似含义的列的集合,列属于哪个列族由行决定 - 列(column)
某个列族下的一个具体列 - 行键(rowkey)
代表当前行的唯一标识,独立于表中的任何字段和数据
单元格(cell)
列族,列,行键确定一个单元格
时间戳(timestamp)
每个单元格下可以有多条记录,按照时间戳倒序排序
如果不指定,默认执行当前时间的时间戳
如果指定,按照指定的时间戳执行
3. HBase运行原理
- client:客户端,与HBase数据库做交互
- zookeep