HBase概述 1)构建在HDFS之上 2) 分布式: 分而治之 3)面向列: HBase特点 1)大 2)面向列:数据构成,列族(多个列) 3)稀疏:null 4)数据类型单一:string 5)无模式: 每行数据所对应的列是可以不同 user: id name password age info.... 在创建表的时候就需要指定的 6)数据多版本 Cell HBase和RDBMS的区别 1)phoenix、hive&hbase 2)hbase在上亿条的数据查询可以控制在毫秒或者秒内(rowkey的设计好坏) rowkey + cf + col + timestamp ==> value xx1 + basic_info + name + t1(默认就是时间戳) ==> zhangsan xx1 + private_info + age + t1 ==> 25 HBase核心术语 1)rowkey 主键 对应于RDBMS的主键 字符串,字典顺序存储,在HBase内存保存为字节数组 rowkey查询方式:单个rowkey、range、全表扫描 2) column family/cf 列族