对Hive分区表进行新增字段后,会出现一个奇怪的情况,就是往 已经存在的 分区中装载数据后,某些字段的值显示为null,但实际情况是数据文件中对应的字段值其实是有值的。
下面我们重现该问题:
-
创建一个分区表
-
往表中装载数据
-
给表新增分区
-
再往表中装载数据并查询
数据装载成功后,通过查询可以看出,新创建的分区中数据显示正常,但是已经存在的time=20171010分区中新增数据后,新增的字段显示为null。难道数据没有插入成功? -
查看分区表在HDFS上对应的数据
可以看出hive