Hive调优方式
文章目录一、建表注意事项1、分区、分桶2、一般使用外部表,避免数据误删3、选择适当的文件储存格式及压缩格式4、命名要规范5、数据分层,表分离,但是不要分的太散二、查询优化1、分区裁剪 where过滤,先过滤,后join2、分区分桶,合并小文件3、适当的子查询4、排序方式三、Hive数据倾斜优化数据倾斜出现原因表现数据倾斜解决具体解决四、作业优化一、建表注意事项1、分区、分桶一般按照业务日期进行分区,每天的数据放在一个分区里,这样可以查询每一天的数据,避免了全局扫描,提高效率2、一般使用外部表,避免数







