“用dom4j解析包”对xml进行dom方式操作中文乱码解决方案

IT程序员开发必备-各类资源下载清单,史上最全IT资源,个人收藏总结!

package  edu.dom4j.dom;

import java.io.FileOutputStream;

import java.io.FileWriter;

import java.io.OutputStreamWriter;

import java.io.IOException;

import org.dom4j.Attribute;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Node;

import org.dom4j.io.OutputFormat;

import org.dom4j.io.SAXReader;

import org.dom4j.io.XMLWriter;

import org.junit.Test;

public class XmlCharset {

  private String xmlfile = "WebRoot/product2.xml";

  private  Attribute attribute;

  private Node node ;

  public Document getDocument () throws DocumentException {

   //获得dom4j解析器

   SAXReader reader = new SAXReader();

   //读取xml文档:注意是org.dom4j.Document包下

   Document document = reader.read(xmlfile);

   return document;

  }

 /**

  * 运行环境:

  *   (1)product2.xml中encoding="utf-8" 或者encoding="gb2312"(是否乱码结果一样)

 *   (2)本地编码:gb2312

  **/

  @Test

  public void formatXml2system_1() throws DocumentException, IOException{

   Document document = getDocument();

   /*

    * 1.将document对象以Compact format的方式打印到System.out

    *  结果:  OK

    */

   OutputFormat format = OutputFormat.createCompactFormat();

   format.setEncoding("gb2312");

   XMLWriter writer = new XMLWriter(System.out,format);

   writer.write(document);

   writer.flush();

   /*

    *  结果:  乱码

    */

   format = OutputFormat.createCompactFormat();

   format.setEncoding("utf-8");

   writer = new XMLWriter(System.out,format);

   writer.write(document);

  writer.flush();

   /*

    * 结果:  OK

    */

   format = OutputFormat.createCompactFormat();

   writer = new XMLWriter(new OutputStreamWriter(System.out,"gb2312"),format);

  writer.write(document);

   writer.flush();

 

   /*

    *  结果: OK

    */

  format = OutputFormat.createCompactFormat();

   format.setEncoding("utf-8");

   writer = new XMLWriter(new OutputStreamWriter(System.out,"gb2312"),format);

   writer.write(document);

   writer.flush();

   /*

    *  结果: 乱码

    */

   format = OutputFormat.createCompactFormat();

   writer = new XMLWriter(new OutputStreamWriter(System.out,"utf-8"),format);

   writer.write(document);

   writer.flush();

   /*

   *  结果:OK

   */

   format = OutputFormat.createCompactFormat();

   writer = new XMLWriter(new OutputStreamWriter(System.out),format);

   writer.write(document);

   writer.flush();

  

  }

  /**

   * 运行环境:

   *   (1)product2.xml中encoding="utf-8" 或者encoding="gb2312"(是否乱码结果一样)

   *      但是生成的product3.xml的encoding=""编码由format的编码决定

   *   (2)本地编码:gb2312

   **/

  @Test

  public void formatXml2system_2() throws DocumentException, IOException{

   Document document = getDocument();

   String product3 = "WebRoot/product3.xml";

  

   /*

   * 1.将document对象更新至product2.xml或新建xml

   *   结果:乱码

   */

   OutputFormat format = OutputFormat.createPrettyPrint();

   XMLWriter writer = new XMLWriter(new FileWriter(product3),format);

   writer.write(document);

   writer.flush();

  /*

   *   结果:乱码

   */

   format = OutputFormat.createPrettyPrint();

   format.setEncoding("utf-8");

   writer = new XMLWriter(new FileWriter(product3),format);

   writer.write(document);

   writer.flush();

  /*

   *   结果 :OK

   */

   format = OutputFormat.createPrettyPrint();

   format.setEncoding("gb2312");

   writer = new XMLWriter(new FileWriter(product3),format);

   writer.write(document);

   writer.flush();

  /*

   *   结果:OK

   */

   format = OutputFormat.createPrettyPrint();

   writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream(product3),"utf-8"));

   writer.write(document);

   writer.flush();

  /*

   *   结果:乱码

   */

   writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream(product3),"gb2312"));

   writer.write(document);

   writer.flush();

 

  /*

   *   结果:OK

   */

   format = OutputFormat.createPrettyPrint();

   writer = new XMLWriter(new FileOutputStream(product3));

   writer.write(document);

   writer.flush();

  /*

   *   结果:OK 

   */

   format = OutputFormat.createPrettyPrint();

   //product3.xml中生成的encoding=""编码由format决定

   format.setEncoding("gb2312");

   writer = new XMLWriter(new FileOutputStream(product3),format);

   writer.write(document);

   writer.flush();

  }

}

product2.xml文档:

<?xml version="1.0" encoding="utf-8"?>

<catalog id="cata1"> 

  <product category="HandTool" inventory="InStock"> 

    <specifications weight="2.0kg">扳手</specifications>  

    <price street="香港街">80.0</price>  

    <notes>这是扳手</notes>  

  </product>  

  <product category="Table"> 

    <specifications>桌椅</specifications>  

    <price street="澳门街" wholesale="部分">100.0</price> 

  </product> 

</catalog>






  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DOMdom4j都是用于解析XML文档的工具,它们的使用方法略有不同。下面分别介绍DOMdom4j解析XML的使用方法: 1. 使用DOM解析XML 使用DOM解析XML时,需要按照以下步骤进行: ```java // 1. 创建 DocumentBuilderFactory 对象 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); // 2. 创建 DocumentBuilder 对象 DocumentBuilder builder = factory.newDocumentBuilder(); // 3. 通过 DocumentBuilder 解析 XML 文件,得到 Document 对象 Document document = builder.parse(new File("xml文件路径")); // 4. 获取根节点 Element root = document.getDocumentElement(); // 5. 获取子节点、属性节点等 NodeList nodeList = root.getElementsByTagName("节点名称"); for (int i = 0; i < nodeList.getLength(); i++) { Node node = nodeList.item(i); if (node.getNodeType() == Node.ELEMENT_NODE) { Element element = (Element) node; // 获取子节点等操作 } else if (node.getNodeType() == Node.ATTRIBUTE_NODE) { Attr attribute = (Attr) node; // 获取属性节点等操作 } } ``` 2. 使用dom4j解析XML 使用dom4j解析XML时,需要按照以下步骤进行: ```java // 1. 读取 XML 文件 SAXReader reader = new SAXReader(); Document document = reader.read(new File("xml文件路径")); // 2. 获取根节点 Element root = document.getRootElement(); // 3. 获取子节点、属性节点等 List<Element> nodeList = root.elements("节点名称"); for (Element element : nodeList) { // 获取子节点等操作 List<Attribute> attributeList = element.attributes(); for (Attribute attribute : attributeList) { // 获取属性节点等操作 } } ``` 以上是DOMdom4j解析XML的基本使用方法。需要注意的是,使用DOM解析XML时,由于要将整个XML文档加载到内存中,因此对于大型XML文档,可能会出现内存溢出等问题。而dom4j相对于DOM,提供了更加方便的API和更高效的内存管理方式,因此在解析大型XML文档时,dom4j可能更加适合。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值