dom4j 中文乱码问题

在用 dom4j 以 utf8 编码格式生成 xml 文档后,发现该 xml 文档包含中文的部分异常,无法读取。随后被逼无奈,只好使出猥琐招数,直接将要写入 xml 的字符串重新以 utf8 格式编码后再写入 xml:

str = new String(str.getBytes(), "UTF8");

终于,xml 文档异常消除,可以正常读取。然而,其中的中文部分是却乱码,悲了个剧,事情为什么是这个样子呢?


终于知道:问题在于 FileWriter 类的滥用,将 FileWriter 改为 FileOutputStream 之后,问题解决。

1 dom4j 中 XMLWriter 对文件的处理过程:

    public XMLWriter(OutputStream out) throws UnsupportedEncodingException
    {
        this.format = DEFAULT_FORMAT;
        this.writer = createWriter(out, format.getEncoding());
        this.autoFlush = true;
        namespaceStack.push(Namespace.NO_NAMESPACE);
    }
    public XMLWriter(OutputStream out, OutputFormat format) throws UnsupportedEncodingException
    {
        this.format = format;
        this.writer = createWriter(out, format.getEncoding());
        this.autoFlush = true;
        namespaceStack.push(Namespace.NO_NAMESPACE);
    }
    protected Writer createWriter(OutputStream outStream, String encoding) throws UnsupportedEncodingException
    {
        return new BufferedWriter( new OutputStreamWriter( outStream, encoding ));
    }

结论:dom4j 在生产 xml 文档时,构造其 XMLWriter 所需参数为 OutputStream 对象,而非 Writer 对象。


2 示例:

public void createXML(String fileName) 
{
    Document doc = DocumentHelper.createDocument();
    Element rootElement = doc.addElement("animal");
    rootElement.addAttribute("name", "汤姆猫");
    Element ageElement = rootElement.addElement("age");
    ageElement.setText("3岁");
    Element colorElement = rootElement.addElement("color");
    colorElement.setText("黄色");
    try 
    {
        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("UTF-8");
	    //XMLWriter xmlWriter = new XMLWriter(new FileWriter(fileName), format); 
        XMLWriter xmlWriter = new XMLWriter(new FileOutputStream(fileName), format);
        xmlWriter.write(doc);
        xmlWriter.close();
    }
    catch (Exception e) 
    {
        System.out.println(e);
    }
}

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值