项目中有一个需求是根据业务参数改写本地一个xml文件然后提交给第三方,本地测试没有问题,但生产环境提交给第三方就出现异常。由于第三方是一个封闭软件,没有提供错误日志,只能自己排查bug。先查看源代码,查了半天看不出问题。突然想起是不是文件编码问题,于是将开发环境和生产环境输出的文件进行对比,发现修改前xml文件的编码是UTF-8,但修改后就变成了非UTF-8编码。定位代码中保存xml的方法:
OutputFormat outputFormat = OutputFormat.createPrettyPrint();
outputFormat.setEncoding("UTF-8");//设置编码
XMLWriter xmlWriter = new XMLWriter(new FileWriter(xmlFilePath),outputFormat);
xmlWriter.write(document);
xmlWriter.close();
猛一看没有问题,指定了UTF-8编码,在开发环境下(IDE执行)确实也没有问题,百思不得其解。
后来抱着试一试的心态,没有使用FileWriter(字符流)作为参数的构造函数,而是使用了FileOutputStream(字节流)作为参数的构造函数来new XMLWriter(),bug奇迹的消失了。
抱着知其然还要知其所以然的心态,查看了下2个构造函数的源代码,发现使用了FileOutputStream参数的代码里使用了outputFormat的编码,而FileWriter的竟然没有,我的个乖乖,这是大名鼎鼎的dom4J一族能干出的事情么?
补充:为什么开发环境下没有问题,因为FileWriter不能指定文件写入编码,默认使用环境指定编码,IDE设置了UTF-8,而操作系统由于是win的中文系统非UTF-8编码,所以产生了这种偏差。