使用hbase shell 常用的命令可解决的问题
#导语
我们在使用hbase shell 查看数据时经常会为hbase中存放的double、string等类型转为16进制而烦恼,也会为多字段过滤而烦恼今天你就可以在文章中找到这些问题的解决方法。
hbase shell中常用的命令可解决的问题
– hbase 获取某个rowkey的值
get ‘命名空间:表名字’,‘rowkey’
–hbase 指定起始rowkey 查询数据 指定value 中包含xxx查询
scan ‘命名空间:表名字’, { STARTROW => ‘id02’, STOPROW => ‘id03z’,FILTER=>“ValueFilter(=,‘substring:111’)”,COLUMNS => ‘cf2’}
–获取表所对应的Region个数(
get_splits ‘my_ns:person’
–将16进制转换为中文,可以把字符串类型转换为string
get ‘命名空间:表名字’,‘rowkey’,‘F2:hejibs:toString’
–将hbase底层的16进制转换成Double
get ‘命名空间:表名字’,‘rowkey’,‘F2:hejibs:toDouble’
–get获取不同类型的字段Double 跟String
get ‘my_ns:myTable’,‘00010001_001’,COLUMNS=>[‘F2:jioyrq:toString’,‘F2:jio1je:toDouble’]
–scan 获取不同字段的Double 跟string类型
scan ‘my_ns:myTable’,{COLUMNS=>[‘F2:jioyrq:toString’,‘F2:jio1je:toDouble’],LIMIT=>10}
–rowkey的前缀过滤器 (rowkey以5开头的)
scan ‘命名空间:表名字’,{ROWPREFIXFILTER=>‘5’}
–对F2列族里面同时符合营业机构为3666的和交易日期为20221005的进行筛选
scan ‘命名空间:表名字’,{FILTER=>“SingleColumnValueFilter(‘F2:yngyjg’,=,‘binary:3666’)AND SingleColumnValueFilter(‘F2:jioyrq’,=,‘binary:20221005’)”}
–CDP集群,即HBase2.X后 可以直接put Double类型的数据
put ‘my_ns:myTable’,‘0101010_000001’,‘F2:jio1je’,Bytes.toBytes(12.44)
– 删除hbase表
truncate_preserve ‘命名空间:表名字’ hbase删除表操作不删除分区信息
– 把某一hbase表给 hive用户授予 wxca 权限
grant ‘hive’,‘RWXCA’,‘命名空间:表名字’
– 统计hbase数据量
count ‘表名字’ 统计hbase里面的数据
–对Hbase的Hfile进行合并操作,有时连接超时可以使用major_compact 提高本地化率
major_compact ‘my_ns:myTable’
–在linux操作界面上获取表的meta信息 这个语句也可以写在脚本里哦
echo “scan ‘hbase:meta’” | hbase shell | grep ‘my_ns:myTable’
– 通过hbase自带jar中统计行的类 在linux中运行就可以了
hbase org.apache.hadoop.hbase.mapreduce.RowCounter ‘表名字’