最近,在用Java api读写Hbase数据库,时常需要用Hbase shell在命令行校验结果是否准确,在这里简单记录下一些常用的Hbase shell命令,以作备忘。
(1)创建表
create ‘tableName’,‘familyName1’,...,'familynameN' 创建表和列簇
(2)删除表
disable 'tableName' 将表离线
drop 'tableName' 对表做删除标记
exists 'tableName' 判断表是否存在
truncate 'tableName' 清空表
(3)增加或更新记录(列不存在的话则是新增,列若存在则更新)
put 'tableName','rowkey','familyName:columnName','columnValue'
(4)get查询
get 'tableName','rowkey'(取出rowkey对应的多个列簇和列)
get 'tableName','rowkey','familyName:columnName' (取出rowkey对应的指定列簇和列)
get 'tableName','rowkey',{COLUMN=> ['column1','column2','column3']} (取出指定列簇多个列)
(5)scan扫描
scan 'tableName' (全表扫描)
scan 'tableName',{COLUMN=>['column1','column2'],LIMITS=>10,STARTROW=>'',STOPROW=>''}(限定列,记录数,起止行)
(6)借助过滤器,scan扫描
在shell中导入相应java类
import org.apache.hadoop.hbase.filter.SubstringComparator
import org.apache.hadoop.hbase.filter.RowFilter
import org.apache.hadoop.hbase.filter.CompareFilter
import org.apache.hadoop.hbase.filter.SingleColumnValueFilter
import org.apache.hadoop.hbase.util.Bytes
行键过滤器
scan 'tableName',{LIMIT => 5, FILTER => RowFilter.new(CompareFilter::CompareOp::EQUAL, SubstringComparator.new(strofrowkey))}
列值过滤器
scan 'tableName',{FILTER=>SingleColumnValueFilter.new(Bytes.toBytes(familyName),Bytes.toBytes(columnName),CompareFilter::CompareOp.valueOf('EQUAL'),Bytes.toBytes(value))}
scan 'member', FILTER=>"ValueFilter(=,'binary:26')" scan 'member', FILTER=>"ValueFilter(=,'substring:6')"
scan 'member', FILTER=>"ColumnPrefixFilter('birth') "
scan 'member', FILTER=>"ColumnPrefixFilter('birth') AND ValueFilter ValueFilter(=,'substring:1987')"
scan 'member', FILTER=>"FirstKeyOnlyFilter()" 仅取出每个列簇的第一个column的第一个版本。
scan 'member', FILTER=>"KeyOnlyFilter()" 对于每一个column只去取出key,把VALUE的信息丢弃,一般和其他filter结合使用。
scan 'member', FILTER=>"PrefixFilter('E')" 对Rowkey的前缀进行判断,
其他过滤器类似,引入相应的类,修改相应的过滤条件
(7)删除列族
disable‘tablename’,
再alter ‘tablename’,{NAME=>'columnfamily',METHOD=>'delete'},
enable ‘tablename’
(8)其他命令
count ‘tableName’ 统计行数
list 显示已存在的表
describe ‘tableName’ 显示表列簇
status 查询服务器状态
version 查询版本
get_counter 'tablename','columnName','coulumnFamily:column'获取当前count的值
先写这么多,后续有常用的命令再继续补充