JavaWeb开发 详解XML

1.XML简介

XML是可扩展(所谓可扩展就是程序员自己可以定义)的标记性语言。

  • XML的主要作用如下:

  • 1.用来保存数据。而且这些数据具有自我描述性。

  • 2.它还可以作为项目或者模块的配置文件。

  • 3.还可以作为网络传输数据的格式。(现在以JSON为主)。


2.XML语法

2.1 文档说明

xml可以用来保存数据。下面我们来体验下,创建一个xml文件,用来描述图书信息。

步骤(1)创建一个xml文件
在这里插入图片描述

文件名:
在这里插入图片描述

步骤(2):编写xml文件。
注意:图书有出版号sn 表示唯一标识,书名,作者,价格的信息。

<?xml version="1.0" encoding="utf-8" ?>
<!--
    <?xml version="1.0" encoding="utf-8" ?>
    以上内容是xml文件的声明
    version="1.0"  version表示xml的版本
    encoding="utf-8"  encoding表示xml文件本身的编码
 -->
<books><!--books 表示多个图书信息-->
      <book sn="1234">   <!--book 表示一个图书信息  sn属性表示图书序列号-->
          <name>java从入门到放弃</name>   <!--name标签 表示书名-->
          <author>Sun</author>      <!--author标签 表示作者-->
          <price>300</price>        <!--prcie标签  表示价格-->
      </book>

    <book sn="12345">   <!--book 表示一个图书信息  sn属性表示图书序列号-->
        <name>数据库原理</name>   <!--name标签 表示书名-->
        <author>张三</author>      <!--author标签 表示作者-->
        <price>100</price>        <!--prcie标签  表示价格-->
    </book>

</books>

此xml文件也可以在浏览器中进行查看。
在这里插入图片描述


2.2 xml中的元素(标签)

2.2.1 xml中元素的理解

首先,来说明下XML元素的含义。XML元素指的是从(且包括)开始标签直到(且包括)结束标签的部分。

元素可包含其他元素、文本或者两者的混合。元素也可以拥有属性。

在这里插入图片描述


2.2.2 XML中的命名规则

XML中的命名规则
名称可以含字母、数字以及其他字符
名称不能以数字或者标点符号开始
名称不能包含空格

名称可以包含字母、数字以及其他的字符

 <book sn="SN12341232">
        <name>辟邪剑谱</name>
        <price>9.9</price>
        <author>班主任</author>
    </book>

名称不能以数字或者标点符号开头
在这里插入图片描述
名称不能包含空格
在这里插入图片描述

注意:XML中的元素(标签)也分为单标签和双标签:

单标签:
格式:<标签名 属性1=’'值" 属性2=“值” …/>

双标签:
格式:<标签名 属性1=“值” 属性2=“值”…>文本数据或子标签</标签名>

在这里插入图片描述


2.3 xml属性

xml的标签属性和html的标签属性是非常类似的,属性可以提供元素的额外信息。

  • xml文件中一个标签上可以书写多个属性,每个属性必须使用引号引起来。

属性必须使用引号引起来,不引会报错
在这里插入图片描述


2.4 xml中的语法规则

(1) 所有的xml标签都必须关闭标签(闭合标签)

在这里插入图片描述

(2) xml标签对大小写敏感


在这里插入图片描述

(3) xml必须正确地进行嵌套


在这里插入图片描述


(4) xml文档中必须有根元素

根元素就是顶级元素。没有父标签的元素就是顶级元素。根元素是没有父标签的顶级元素,而且是唯一一个。

在这里插入图片描述

(5) xml中的特殊字符

在这里插入图片描述


3.xml解析技术

xml可扩展的标记语言。不管是html文件还是xml文件,它们都是标记型文档,都可以使用w3c组织制定的dom技术来解析。
在这里插入图片描述

document对象表示整个文档(可以是html文档,也可以是xml文档)。

早期 JDK 为我们提供了两种 xml 解析技术 DOM 和 Sax 简介。

dom解析技术是W3C组织制定的,而所有的编程语言都对这个解析技术使用自己语言的特点进行实现。Java对dom技术解析标记做了实现。

sun公司在JDK5版本对dom解析技术进行升级:SAX(Simple API for XML)。SAX解析,与W3C制定的解析不太一样,它是以类似事件机制通过回调告诉用户当前正在解析的内容。它是一行一行的读取xml文件进行解析的,不会创建大量的dom对象。

第三方的解析:

  • jdom在dom基础上进行了封装
  • dom4j又对jdom进行了封装

dom4j是第三方的解析技术,可以使用第三方给我们提供好的类库才可以解析xml文件。


4.dom4j解析技术

由于dom4j属于第三方公司的技术,我们需要使用dom4j,就需要到dom4j官网上进行下载dom4j的jar包。


4.1 dom4j类库使用

将dom4j官网上下载的dom4j的压缩包进行解压。

在这里插入图片描述


4.2 dom4j目录的介绍

(1)dom4j是文档目录
在这里插入图片描述

(2)如何查dom4j的文档

在这里插入图片描述


(3)lib目录
在这里插入图片描述
(4)src目录是第三方类库的源码目录:
在这里插入图片描述


4.3 dom4j编码步骤

dom4j编码步骤:

  • 第一步:先加载xml文件创建Document对象。
  • 第二步:通过Document对象拿到根元素对象。
  • 第三步:通过根元素.elements(标签名);可以返回一个集合,这个集合里面放着所有指定的标签名的元素对象。
  • 找到想要修改、删除的子元素,进行相应的操作。
  • 保存在硬盘上。

4.4 获取document对象

创建一个lib目录,并添加dom4j的jar包,并添加到类路径上。

在这里插入图片描述
需要解析的books.xml文件内容

<?xml version="1.0" encoding="UTF-8"?>
<books>
    <book sn="SN12341232">
        <name>辟邪剑谱</name>
        <price>9.9</price>
        <author>班主任</author>
    </book>
    <book sn="SN12341231">
        <name>&lt;葵花宝典&gt;</name>
        <price>99.99</price>
        <author>班长</author>
    </book>
    <book sn="SN12233" name="java从入门到放弃"/><!--单标签-->
</books>

解析获取Document对象的代码:

先创建SaxReader对象。这个对象,用于读取xml文件,并创建Document对象。

/*
    * dom4j获取Document对象
    */
    @Test
    public void test01() throws DocumentException {
        //要创建一个Document对象,需要创建一个SAXReader
        SAXReader saxReader = new SAXReader();
        //saxReader来读取xml文件,然后会返回一个Document对象
        Document doucument = saxReader.read("src/books.xml");
        System.out.println(doucument);

运行后的结果为:
在这里插入图片描述


4.5 遍历xml标签,获取xml标签中的内容

遍历标签,获取所有标签中的内容需要分为四步操作:

  • 第一步:通过创建SAXReader对象。来获取xml对象,获取Document对象。
  • 第二步:通过Document对象,拿到xml的根元素对象
  • 第三步:通过根元素对象,获取所有的标签对象
  • 第四步:遍历每个标签对象,获取标签对象内的每一个元素,再通过getText()方法得到起始标签与结束标签之间的文本内容。
 public void test02() throws Exception {
        /*第一步:通过创建SAXReader对象。来获取xml对象,获取Document对象。
        第二步:通过Document对象,拿到xml的根元素对象
        第三步:通过根元素对象,获取所有的标签对象
        第四步:遍历每个标签对象,获取标签对象内的每一个元素,再通过getText()方法得到起始标签与结束标签之间的文本内容。
    */

        //第一步:通过创建SAXReader对象。来获取xml对象,获取Document对象.
        SAXReader saxReader = new SAXReader();
        Document document = saxReader.read("src/books.xml");
        //第二步:通过Document对象,拿到xml的根元素对象
        Element rootElement = document.getRootElement();
        //第三步:通过xml的根元素对象,获取所有book标签对象
        List<Element> books = rootElement.elements("book");
        //第四步:遍历每个book标签对象,然后获取book标签对象内的每一个元素
        for (Element book : books) {
            //获取book标签下的name元素对象
            Element name = book.element("name");
            //获取book标签下的price元素对象
            Element price = book.element("price");
            //获取book标签下的author元素对象
            Element author = book.element("author");

            //再通过getText()方法获取起始标签与结束标签之间的文本内容
            System.out.println("书名"+name.getText()+",价格:"+price.getText()+
                                ",作者:"+author.getText());
        }
    }

运行后的结果为:
在这里插入图片描述


总结

XML是可扩展(所谓可扩展就是程序员自己可以定义)的标记性语言。XML的主要作用是作为项目或者模块的配置文件。本节需要重点掌握的是dom4j解析技术,可以用来获取xml中所有标签对象中内容。

在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值