hadoop查看指定大小的表和表对应的分区数及小文件个数

查看表大小和分区数
hadoop fs -count -v /user/hive/warehouse/*/* | awk '$3 > (?*1073741824) {print $0}'           --查看大于 ?G的表 单位是 G 
举例:
hadoop fs -count -v /user/hive/warehouse/*/* | awk '$3 > (2*1073741824) {print $0}'           --查看大于 2G的表

hadoop fs -count -v /hive/warehouse/*/* | awk '$3 > (?*1099511627776) {print $0}'             --查看大于 ?T的表 单位是 T
举例: hadoop fs -count -v /user/hive/warehouse/*/* | awk '$3 > (2*1099511627776) {print $0}'  --查看大于 2T的表

结果:DIR_COUNT(代表分区)   FILE_COUNT(文件个数)       CONTENT_SIZE(文件大小字节)  PATHNAME(表名)

以人类可读的格式显示大小
hadoop fs -count -v /user/hive/warehouse/*/* | awk '$3 > (2*1099511627776) {print $0}' | xargs  hadoop fs -count -v -h

查看小文件个数
hadoop fs -ls -R /user/hive/warehouse/db/table/partitions | awk '$5 < ? {count++} END {print count}' --? 代表小文件大小
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值