问题描述:
使用dataX从hive表导数据到oracle表中,发现dataX表对表导数据,在oracle中查询数据有放大!
使用select 查询hive表数据导入oracle数据正常。
分析hdfs数据,发现存在过期的.hive-staging数据。dataX导hive数据会直接读取hdfs目录下文件!
删除.hive-staging数据,msck repair table修复hive表,然后表对表导数正常。
根本解决:
将 hive默认的参数:hive.exec.stagingdir
.hive-staging
修改为 hive.exec.stagingdir
/tmp/hive/.hive-staging
07-12
3712
![](https://csdnimg.cn/release/blogv2/dist/pc/img/readCountWhite.png)
09-28
2372
![](https://csdnimg.cn/release/blogv2/dist/pc/img/readCountWhite.png)
07-08
756
![](https://csdnimg.cn/release/blogv2/dist/pc/img/readCountWhite.png)
07-07
329
![](https://csdnimg.cn/release/blogv2/dist/pc/img/readCountWhite.png)
04-28
“相关推荐”对你有帮助么?
-
非常没帮助
-
没帮助
-
一般
-
有帮助
-
非常有帮助
提交