hive避免执行mr获取最大分区

文章介绍了如何通过在Hive中避免直接使用`SELECTMAX`查询来获取最大分区,以减少资源消耗和提高查询速度,方法是先执行`SHOWPARTITIONS`命令获取分区列表,再通过shell和awk/sed筛选出最大分区时间。
摘要由CSDN通过智能技术生成

因为直接select max(dt) from hiveTab会占用较多资源并且速度很慢,执行show partitions hiveTab然后通过shell可以避免执行mr快速获取最大分区。

# 获取分区列表(按时间倒序)
partitions=$(hive -e "SHOW PARTITIONS $hiveTab" | sort -r)

# 筛选出最大分区时间
max_part=$(echo $partitions | awk '{print $1}' | sed "s/$partition_columns=//g")

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值