我们在创建各个层次表格的时候如果没有设置读取方式,hive在读取数据的时候会产生一定的脏数据
出现 __HIVE_DEFAULT_PARTITION__ 这样的分区
解决方法为
在创建表格的时候,先执行set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat;
当然如果已经出现了脏数据,可以将hdfs上脏数据分区原始数据进行删除
再将表格中的脏数据分区进行删除
alter table dwd_order_info drop partition (dt='__HIVE_DEFAULT_PARTITION__');
在重新写入一次数据就可以去掉脏数据了
在执行的时候注意自己使用的数据库正确与否