问题:
azkaban中的py脚本定时从hdfs中读取数据到hive表,但是数据一直没有落地到hive
解决方案:
- 首先在azkaban的project中找到该project;进入该project并下载压缩包
- 下载之后解压找到有问题的脚本并打开
- 找到py脚本中的hdfs路径
- Xshell 连接到服务器,执行
-
hadoop fs -ls /usr/......(上面的路径)
发现
没有该目录,问题已经明了
-
找到正确的路径,发现hdfs的文件都存在该目录下
-
-
在py脚本中改正并上传到azkaban中.