‘’
两个单引号 当命令行出现星号的时候使用
hbase shell
进入hbase
ctrl+backspace
退格
ddl
dml
list
help
查看所有命令
create ‘probe_log’,‘info’
创建表,表名+列族名,该名称任意
describe ‘probe_log’
查看表信息 表名
create_namespace ‘probe_log’
新建命名空间create
create ‘probe_log:user_event_v2’,‘info’
在命名空间下新建表
put ‘probe_log:user_event_v2’,‘1001’,‘info:vin’,‘testvin’
插入数据:表名,id,列族名:列名,值
scan ‘probe_log:user_event_v2’
查看数据 表名 也可带时间戳
hdfs dfs -ls /hbase/data/probe_log
查看hbase表所在的位置
默认情况下,在创建 HBase 表的时候会自动创建一个 region 分区,当导入数据的时候, 所有的 HBase 客户端都向这一个 region 写数据,直到这个 region 足够大了才进行切分。一 种可以加快批量写入速度的方法是通过预先创建一些空的 regions,这样当数据写入 HBase 时,会按照 region 分区情况,在集群内做数据的负载均衡。
在合理范围内能尽量少的减少列簇就尽量减少列簇。
注意:
服务器里用shell查到
column=info:province, timestamp=1623308045785, value=\xE5\xB9\xBF\xE4\xB8\x9C,
在api中scan就可以正常显示中文:广东