Unexpected end of input stream错误,错误日志如下:
主要原因是gz.gz这种文件无法解压,碰巧gz.gz又是空文件,所以可以在spark-submit加参数忽略他
--conf spark.sql.files.ignoreCorruptFiles=true
//完整的提交语句如下
spark-submit --master yarn --deploy-mode cluster --conf spark.sql.files.ignoreCorruptFiles=true --conf spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version=2 --driver-memory 2G --class com.yeahmobi.dw.BidDetailToHive s3://xxx/xxx/xx-xx-1.0-SNAPSHOT.jar
ps.这个参数在spark2.1以后才有效