HBase概述
1)构建在HDFS之上
2) 分布式: 分而治之
3)面向列:
HBase特点
1)大
2)面向列:数据构成,列族(多个列)
3)稀疏:null
4)数据类型单一:string
5)无模式: 每行数据所对应的列是可以不同
user: id name password age info.... 在创建表的时候就需要指定的
6)数据多版本
Cell
HBase和RDBMS的区别
1)phoenix、hive&hbase
2)hbase在上亿条的数据查询可以控制在毫秒或者秒内(rowkey的设计好坏)
rowkey + cf + col + timestamp ==> value
xx1 + basic_info + name + t1(默认就是时间戳) ==> zhangsan
xx1 + private_info + age + t1 ==> 25
HBase核心术语
1)rowkey 主键
对应于RDBMS的主键
字符串,字典顺序存储,在HBase内存保存为字节数组
rowkey查询方式:单个rowkey、range、全表扫描
2) column family/cf 列族