1.
ANALYZE TABLE XXX COMPUTE STATISTICS;
2. 合并小文件
-- Only RCFile and ORCFile Formats are supported right now
非分区表
alter table XXX concatenate;
分区表
alter table XXX partition(dt='2022-06-06') concatenate;
3. hive 字段名字修改后,值为null
解决方案,按照字段顺序读取值
alter table XXX set tblproperties ('parquet.column.index.access'='true');
4. 查看hive 版本
hive --version
# Hive 2.3.7-amzn-3