hbase的一些知识点
行键–rowkey:用于标志同一行数据,行键相同就是同一条数据
hbase默认对行键进行排序,字典顺序,升序
根据行键建立索引,数据按照行键进行排序,
hbase中的行键不要过长,一般是8的倍数,给16个长度
列簇:一个或者多个列我们成为一个列簇
一个列簇对应一个物理存储文件
列簇设计:
将具有相同io属性的列放在一个列簇中
相同io属性:总是在一起进行读写的列,因人因业务而定,不是固定的
目的是查询的时候不用夸文件查询
经验上来说,列簇不要超过三个,
列是可以动态添加的,不属于表结构的一部分,而是添加数据的时候指定
建表的时候不需要指定列名
版本号
数据插入的时候,hbase自动插入的一个字段,用于标识数据的版本的,一般情况下是liunx时间戳
(插入数据的时间戳)
在hbase中,同一个数据可以存储多个版本的,通过版本号进行区分的
在hbase中向定位一个列需要知道:
行键,列簇,列名,版本号
hbase扫描的三种方式
1.全表扫描:所有行键,所有列簇的数据
2.指定行键的范围进行扫描
3.扫描指定行键数据