一、记录条数
1、hbase shell中执行count的命令(效率太低)
INTERVAL是统计的行数间隔,默认为1000;
CACHE是客户端缓存条数
hbase(main):001:0> count 'boco:DW_F_XDR_HTTP_FGCSVSH_USR_H', INTERVAL => 10000,CACHE => 1000
1405253428 row(s) in 19903.5410 seconds
=> 1405253428
执行时间:5时31分43秒
2、Hbase自带统计行数 mapreduce 工具类
[boco@hadoop01 ~]$ hbase org.apache.hadoop.hbase.mapreduce.RowCounter 'boco:DW_F_XDR_HTTP_FGCSVSH_USR_H'
org.apache.hadoop.hbase.mapreduce.RowCounter$RowCounterMapper$Counters
ROWS=1404276286 //总记录数
执行用时:4分59秒
2019.09.18 10:21:20 CST 2019.09.18 10:26:19 CST job_1566288376023_2726039 rowcounter_boco:DW_F_XDR_HTTP_FGCSVSH_USR_H
二、文件大小
[boco@hadoop01 ~]$ hdfs dfs -du -h /hbase/data/boco/
109.8 G 329.4 G /hbase/data/boco/DW_F_XDR_HTTP_FGCSVSH_USR_H