前一段时间刚开始学习用Hadoop,在输出的时候,每运行一次就要把输出目录给删了,否则就会抛异常。后来就查看Hadoop源码,自定义OutputFormat ,然后重写 checkOutputSpecs 方法,在FileOutputFormat 里面,这个方法会检查输出目录是否存在,如果存在就直接抛异常。
前一段时间刚开始学习用Hadoop,在输出的时候,每运行一次就要把输出目录给删了,否则就会抛异常。后来就查看Hadoop源码,自定义OutputFormat ,然后重写 checkOutputSpecs 方法,在FileOutputFormat 里面,这个方法会检查输出目录是否存在,如果存在就直接抛异常。