Hive 中数据库表的分区建议

Hive 数据仓库,对经常查询的大数据表建立分区就是对Hive SQL查询的一种优化,一般常用日期做分区,因为日期一直以来业务比较关注的统计维度,比如年度报告,月度报告,甚至季度报告等等。

个人建议:使用年月日分区,作三分区,在建表语句之后使用 partitioned by (pt_year int, pt_month int, pt_date int) 增加分区后,在查询时加入分区条件可以提高查询到速度和降低内存消耗。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值