1、分区字段,对大数据量查询有质的提升,常见的分区字段有时间分区和业务分区
2、了解业务表数据构成,对于唯一字段就不要重复groupby了
3、多个union如果只是关联条件不一样,只需要扩增on条件就可以了
4、涉及到要多次关联大表查询的,可以采用临时表,然后再关联
5、大数据量去重,groupby的效率高于distinct
hivesql优化
最新推荐文章于 2022-05-05 14:35:12 发布
1、分区字段,对大数据量查询有质的提升,常见的分区字段有时间分区和业务分区
2、了解业务表数据构成,对于唯一字段就不要重复groupby了
3、多个union如果只是关联条件不一样,只需要扩增on条件就可以了
4、涉及到要多次关联大表查询的,可以采用临时表,然后再关联
5、大数据量去重,groupby的效率高于distinct