创建表
一、创建表
create ‘表名’,{NAME=>‘列簇名’},{NAME=>‘列簇名’}…
二、插入数据
put ‘表名’,‘行键名’,‘列簇名:列名’,‘值’
三、更改数据
和插入一样,还是put,相同rowkey,会根据最近的时间戳对应的数据有效
原来的数据并不是被覆盖,其实还存在,只不过在闲时偷偷删除(时间比较慢),如果想保留原来的,请使用 VERSIONS
四、查询数据
1、查看表
list:查看所有表
desc ‘表名’:查看表结构
scan ‘表名’:查看表中所有数据
2、查看表中指定内容
get '表名','行键'
get '表名','行键','列簇'
get '表名','行键','列簇:列名'...
【Tips:当我们put同一个行键同一个列簇同一个列时,就value不同时,HBase会默认读最新时间戳的数据,导致原来的数据不会被显示,那么我们想看之前的数据怎么办?】
答:利用VERSIONS
简单方式
复杂方式
1.简单方式
scan ‘表名’,{RAW=>true,VERSIONS=>10}
2.复杂方式
修改版本号
alter ‘表名’,NAME=>‘列簇名’,VERSIONS=>‘3’
官方指定修改版本方式
然后插入数据
利用版本号查看
get ‘表名’,‘行键’,{COLUMN=>‘列簇名’,VERSIONS=>3}
3、查看指定范围行键
【左闭右开】
scan ‘表名’,{STARTROW=>‘rk1’,STOPROW=>‘rk4’}
1
五、删除数据
1、删除数据
delete ‘表名’,‘行键’,‘列簇’
deleteall ‘表名’,‘行键’,‘列簇’
2、删除表
要删除表得先disable
disable ‘表名’
drop ‘表名’
truncate ‘表名’:清空数据
真正删除数据
Flush
Flush只会删除当前memStore中重复的数据(timestamp最新的会被删除)
StoreFile重复的并不会被删除
被标记为DeleteColumn的不会被删除
Compact
Major Compact也会进行删数据(当文件数>=3时,compact调用的也是major compact)
major compact 会将全部重复的数据进行删除,包括Storefile中的
major compact会将被标记为DeleteColumn的删除