XML介绍及用法-CSDN博客

本文链接：https://blog.csdn.net/2301_78714573/article/details/140052962

XML（可扩展标记语言）的文档结构通常包括以下几个主要部分：

XML声明（XML Declaration）：XML文档的开头通常是一个XML声明，用于指定XML的版本和字符集（编码）。例如：
```
<?xml version="1.0" encoding="UTF-8"?>
```
根元素（Root Element）：XML文档中必须有且仅有一个根元素，所有其他元素都是根元素的子元素。根元素包围了整个文档的内容。
元素（Elements）：XML文档中的基本构建块是元素。元素可以包含文本、属性、子元素或者它们的组合。
属性（Attributes）：元素可以有零个或多个属性，属性提供有关元素的额外信息。属性通常写在元素的开始标签中。
注释（Comments）：XML文档可以包含注释，注释以  结束。
命名空间（Namespaces）：XML文档可以使用命名空间来避免元素和属性名称冲突，或者用于分组元素。
处理指令（Processing Instructions）：处理指令以 <? 开始，以 ?> 结束，用于指示处理应用程序的信息。

一个简单的XML文档的示例：

<?xml version="1.0" encoding="gb2312"?>
<PhoneInfo>
    <Brand name="华为">
        <Type name="P9"></Type>
    </Brand>
    <Brand name="苹果">
        <Type name="iPhone6"></Type>
        <Type name="iPhone7"></Type>
    </Brand>
</PhoneInfo>

<PhoneInfo> 是根元素，包含了手机信息的整体。
<Brand> 元素用于表示手机品牌，有两个品牌：华为和苹果。
- <Brand name="华为"> 指明了品牌名称为“华为”，在此品牌下有一个型号 <Type name="P9">，代表华为手机的型号为P9。
- <Brand name="苹果"> 指明了品牌名称为“苹果”，在此品牌下有两个型号：
  - <Type name="iPhone6">，代表苹果手机的型号为iPhone6。
  - <Type name="iPhone7">，代表苹果手机的型号为iPhone7。

使用DOM（Document Object Model）解析XML（eXtensible Markup Language）通常涉及以下几个步骤：

导入相关的包或库：在你的编程环境中，确保能够操作XML的相关类或库已经导入或安装。

创建一个DocumentBuilder对象：DocumentBuilder是一个能够从XML文档创建DOM对象树的工厂类。

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();

解析XML文件：使用DocumentBuilder对象的parse()方法将XML文件解析为一个Document对象。
```
Document document = builder.parse(new File("your_xml_file.xml"));
```
这里的your_xml_file.xml是你要解析的XML文件路径。
获取根元素：从Document对象中获取XML文档的根元素。
```
Element root = document.getDocumentElement();
```

遍历XML文档：使用DOM的方法（如getElementsByTagName()、getChildNodes()等）遍历整个XML文档，从而获取需要的元素或属性数据。

NodeList nodeList = root.getElementsByTagName("your_element_name");
for (int i = 0; i < nodeList.getLength(); i++) {
    Node node = nodeList.item(i);
    if (node.getNodeType() == Node.ELEMENT_NODE) {
        Element element = (Element) node;
        // 处理元素内容或属性
    }
}

获取元素的内容或属性：根据需要，可以使用Element对象的方法来获取元素的文本内容或属性值。
```
String content = element.getTextContent();
String attributeValue = element.getAttribute("attribute_name");
```

使用 DOM4J 操作 XML 数据通常涉及几个基本步骤，如下所示：

1. **导入 DOM4J 库**：
首先，确保你的 Java 项目中包含了 DOM4J 库的依赖。你可以在 Maven 或 Gradle 中添加以下依赖：

```xml
<dependency>
<groupId>org.dom4j</groupId>
<artifactId>dom4j</artifactId>
<version>2.1.3</version> 
</dependency>
```

2. **创建 XML 文档对象**：
使用 DOM4J 创建一个新的 XML 文档对象，并可以选择是否加载现有的 XML 文件。

```java
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;

// 创建一个空的文档对象
Document document = DocumentHelper.createDocument();

// 或者从文件中加载现有的 XML 文档
try {
document = DocumentHelper.parse(new File("path/to/your/xml/file.xml"));
} catch (DocumentException e) {
e.printStackTrace();
}
```

3. **操作 XML 元素**：
使用 DOM4J 的 `Element` 类来操作 XML 元素，包括添加新元素、修改现有元素、删除元素等操作。

```java
// 获取根元素
Element root = document.getRootElement();

// 添加新元素
Element newElement = root.addElement("newElement");
newElement.addAttribute("attributeName", "attributeValue");
newElement.setText("Element text content");

// 修改现有元素
Element existingElement = root.element("existingElement");
existingElement.setText("Updated content");

// 删除元素
Element elementToDelete = root.element("elementToDelete");
if (elementToDelete != null) {
elementToDelete.detach();
}
```

4. **遍历 XML 结构**：
可以使用 DOM4J 提供的方法遍历 XML 结构，访问每个元素及其属性和内容。

```java
// 遍历根元素下的所有子元素
for (Iterator<Element> it = root.elementIterator(); it.hasNext();) {
Element element = it.next();
System.out.println("Element name: " + element.getName());
System.out.println("Element text: " + element.getText());
// 处理元素的属性
System.out.println("Element attribute value: " + element.attributeValue("attributeName"));
}
```

5. **保存或输出 XML 文档**：
最后，将修改后的 XML 文档保存到文件或将其作为字符串输出。

```java
// 保存到文件
try {
XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
writer.write(document);
writer.close();
} catch (IOException e) {
e.printStackTrace();
}

// 输出到控制台
System.out.println(document.asXML());
```

这些步骤涵盖了使用 DOM4J 库创建、修改和保存 XML 文档的基本操作。通过这些示例，你可以开始在 Java 应用程序中使用 DOM4J 来处理 XML 数据。