XML使用

最新推荐文章于 2025-10-17 00:56:06 发布

原创最新推荐文章于 2025-10-17 00:56:06 发布 · 908 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#xml #java

JavaWeb 专栏收录该内容

17 篇文章

订阅专栏

本文详细介绍了XML的基本概念、语法规范以及解析技术，包括文档声明、元素、属性和语法规则。重点讲解了DOM4J解析XML的步骤，并通过实例展示了如何读取和操作XML文件内容。此外，还对比了DOM和SAX解析的优缺点，以及介绍了第三方解析库如DOM4J和jdom。

一、XML 简介

xml 是可扩展的标记性语言。

xml 的主要作用有：

用来保存数据，而且这些数据具有自我描述性
它还可以做为项目或者模块的配置文件
还可以做为网络传输数据的格式（现在 JSON 为主）

二、XML语法

1、文档声明

我们先创建一个简单 XML 文件，用来描述图书信息。

<?xml version="1.0" encoding="UTF-8"?> xml声明。
    <!-- 
        xml声明 
            version是版本的意思  
            encoding是编码       
            standalone="yes/no" 表示这个xml文件是否是独立的 xml文件 
    --> 
<books>
    <!-- book标签描述一本图书 id属性描述的是图书的编号 --> 
    <book id="SN123123413241"> 
        <!-- name标签描述的是图书的信息 -->
        <name>java编程思想</name> 
        <!-- author单词是作者的意思 ，描述图书作者 --> 
        <author>华仔</author>    
        <!-- price单词是价格，描述的是图书的价格 -->
        <price>9.9</price>   
    </book>
</books>

2、XML元素

元素是指从开始标签到结束标签的内容。

1）XML标签命名规则

名称可以含字母、数字以及其他的字符
名称不能以数字或者标点符号开始
名称不能包含空格

2）xml 属性

xml 的标签属性和 html 的标签属性是非常类似的，属性可以提供元素的额外信息

在标签上可以书写属性：

一个标签上可以书写多个属性。每个属性的值必须使用引号引起来，不引会报错。
规则和标签的书写规则一致。

3、语法规则

所有 XML 元素都须有关闭标签（也就是闭合）
XML 标签对大小写敏感
XML 必须正确地嵌套
XML 文档必须有根元素，根元素就是没有父标签的元素，而且是唯一一个才行
XML 中的特殊字符，例如 >特殊字符：&gt，<特殊字符：&lt
文本区域（CDATA 区），CDATA 语法可以告诉 xml 解析器，我 CDATA 里的文本内容，只是纯文本，不需要 xml 语法解析

CDATA 格式：

<![CDATA[   这里可以把你输入的字符原样显示，不会解析  xml ]]>

三、xml 解析技术

1、xml 解析技术介绍

不管是 html 文件还是 xml 文件它们都是标记型文档，都可以使用 w3c 组织制定的 dom 技术来解析。

document 对象表示的是整个文档（可以是 html 文档，也可以是 xml 文档）

早期 JDK 为我们提供了两种 xml 解析技术 DOM 和 Sax 简介（已经过时，但我们需要知道这两种技术）

dom 解析技术是 W3C 组织制定的，而所有的编程语言都对这个解析技术使用了自己语言的特点进行实现。Java 对 dom 技术解析标记也做了实现。

sun 公司在 JDK5 版本对 dom 解析技术进行升级：SAX（ Simple API for XML ）

SAX 解析，它跟 W3C 制定的解析不太一样。它是以类似事件机制通过回调告诉用户当前正在解析的内容，它是一行一行的读取 xml 文件进行解析的，不会创建大量的 dom 对象。所以它在解析 xml 的时候，在内存的使用和性能上都优于 Dom 解析。

第三方的解析：

jdom 在 dom 基础上进行了封装、
dom4j 又对 jdom 进行了封装。
pull 主要用在 Android 手机开发，是在跟 sax 非常类似都是事件机制解析 xml 文件

2、dom4j 解析技术

由于 dom4j 它不是 sun 公司的技术，而属于第三方公司的技术，我们需要使用 dom4j 就需要到 dom4j 官网下载 dom4j 的 jar 包。

1）dom4j 编程步骤：

先加载 xml 文件创建 Document 对象
通过 Document 对象拿到根元素对象
通过根元素.elelemts(标签名); 可以返回一个集合，这个集合里放着。所有你指定的标签名的元素对象
找到你想要修改、删除的子元素，进行相应的操作
保存到硬盘上

2）具体操作

<?xml version="1.0" encoding="UTF-8"?>
<books>
    <book sn="SN12341232">
        <name>辟邪剑谱</name>
        <price>9.9</price>
        <author>班主任</author>
    </book>
    <book sn="SN12341231">
        <name>葵花宝典</name>
        <price>99.99</price>
        <author>班长</author>
    </book>
</books>

遍历标签获取所有标签中的内容

    @Test
    public void test2() throws DocumentException {
        //1.读取books.xml文件
        SAXReader reader = new SAXReader();
        //在Jubit测试中，相对路径是从模块名开始算
        Document document = reader.read("src/books.xml");

        //2.通过document对象获取根元素
        Element rootElement = document.getRootElement();

        //3.通过根元素获取book标签对象
        //Element.elements(标签名)它可以拿到当前元素下的指定的子元素的集合
        List<Element> books = rootElement.elements("book");

        //4.遍历，处理每个标签转换为Book类
        for(Element book:books){
            //asXML():把标签对象转换为标签字符串
            Element nameElement = book.element("name");
            //asXML()：把标签对象转换为标签字符串
            System.out.println(nameElement.asXML());
            //getText()：文本内容
            System.out.println(nameElement.getText());
            //attributeValue：标签的属性值
            System.out.println(book.attributeValue("sn"));
        }
    }

输出结果：