DBUnit在导出数据库记录时,默认情况下采用的是\”UTF-8\”编码,因此会导致乱码。我在mysql和oracle下分别做了试验,如果是用java application,针对mysql的url字串需要指定编码格式,比如:
jdbc:mysql://127.0.0.1/test?useUnicode=true&characterEncoding=GB2312
而对于oracle,则只需要直接给出url就可以了。
查看了一下DBUnit的源码,FlatXmlDataSet的write方法有三种形式:
public static void write(IDataSet dataSet, Writer writer)
public static void write(IDataSet dataSet, Writer writer, String encoding)
public static void write(IDataSet dataSet, OutputStream out)
如果传入OutputStream对象,就会有问题(具体原因待查),而如果传入FileWriter,则一切正常:
IDataSet fullDataSet = connection.createDataSet();
FlatXmlDataSet.write(fullDataSet, new FileWriter(\”full.xml\”), \”GB2312\”);
encoding参数可以不指定,DBUnit会自动判断,在我的机器上,最后生成的xml,encoding是\”GB1030\”。
另一方面,如果使用build脚本来实现导出功能,则会遇到一些麻烦:
首先,对于mysql的url字串,如果不将&替换成&,则会遇到The reference to entity \”characterEncoding\” must end with the \’;\’ delimiter的错误。
其次,通过查找DBUnit的源码发现,dbunit task中的export,是使用OutputStream作为FlatXmlWriter的传入参数的:
OutputStream out = new FileOutputStream(_dest);
FlatXmlWriter writer = new FlatXmlWriter(out);
writer.setDocType(_doctype);
writer.write(dataset);
不得已,只好将其改为FileWriter的,重新打包后即可彻底解决中文乱码的问题了。
转自:http://morningspace.51.net/weblog/?p=97