XML介绍和基本用法(一文彻底搞懂XML!)

本文详细介绍了XML的基本概念、标签规则、语法规则,以及XML解析中的DOM4J库的使用方法。同时,讨论了XML的约束机制,包括DTD和Schema的定义与引入,强调了它们在限制XML结构和数据类型中的作用。通过实例展示了如何使用DOM4J解析XML文件,并将数据转换为学生对象。最后,探讨了DTD和Schema的约束定义,包括元素和属性的约束规则。
摘要由CSDN通过智能技术生成

1.XML

1.1概述

  • 万维网联盟(W3C)
    万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。 建立者: Tim Berners-Lee (蒂姆·伯纳斯·李)。 是Web技术领域最具权威和影响力的国际中立性技术标准机构。 到目前为止,W3C已发布了200多项影响深远的Web技术标准及实施指南,

    • 如广为业界采用的超文本标记语言HTML(标准通用标记语言下的一个应用)
    • 可扩展标记语言XML(标准通用标记语言下的一个子集)
    • 以及帮助残障人士有效获得Web信息的无障碍指南(WCAG)等
  • xml 概述
    XML的全称为(EXtensible Markup Language),是一种可扩展的标记语言 标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)
    可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的。

  • 作用

    • 用于进行存储数据和传输数据
    • 作为软件的配置文件
  • 作为配置文件的优势

    • 可读性好
    • 可维护性高

1.2标签的规则

  • 标签由一对尖括号和合法标识符组成
<student>
  • 标签必须成对出现
<student></student>
前边的是开始标签,后边的是结束标签
  • 特殊的标签可以不成对,但是必须有结束标记
<address/>
  • 标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来
<student id="1"></student>
  • 标签要正确的嵌套
这是正确的:<student id="1"> <name>张三</name> </student>
这是错误的:<student id="1"> <name>张三</student></name>

1.3语法规则

  • 语法规则
    • XML 文件中的后缀名为:xml

    • 文档声明必须是第一行 第一列
      version:该属性是必须存在的
      encoding:该属性不是必须的
      打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)
      standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no

    • 必须存在一个根标签,有且只能有一个

    • XML文件中可以定义注释信息

    • XML文件可以存在 CDATA区

    • XML文件中可以存在以下特殊字符

&lt; < 小于
&gt; > 大于
&amp; & 和号
&apos; ' 单引号
&quot; " 引号
  • 示例代码
<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>
<!--第一个学生信息-->
<student id="1">
<name>张三</name>
<age>23</age>
<info>学生&lt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;的信息
</info>
<message> <![CDATA[内容 <<<<<< >>>>>> ]]]></message>
</student>
<!--第二个学生信息-->
<student id="2">
<name>李四</name>
<age>24</age>
</student>
</students>

1.4xml解析

  • 概述
    xml 解析就是从 xml 中获取到数据

  • 常见的解析思想
    DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。 会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值
    在这里插入图片描述

  • 常见的解析工具

    • JAXP: SUN公司提供的一套XML的解析的API
    • JDOM: 开源组织提供了一套XML的解析的API-jdom
    • DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java
    • DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java
  • 解析的准备工作

    1. 我们可以通过网站:https://dom4j.github.io/ 去下载dom4j今天的资料中已经提供,我们不用再单独下载了,直接使用即可
    2. 将提供好的dom4j-1.6.1.zip解压,找到里面的dom4j-1.6.1.jar
    3. 在idea中当前模块下新建一个libs文件夹,将jar包复制到文件夹中
    4. 选中jar包 -> 右键 -> 选择add as library即可
  • 需求

    • 解析提供好的 xml 文件
    • 将解析到的数据封装到学生对象中
    • 并将学生对象存储到 ArrayList 集合中
    • 遍历集合
  • 代码实现

<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
<students>
<!--第一个学生信息-->
<student id="1">
<name>张三</name>
<age>23</age>
</student>
<!--第二个学生信息-->
<student id="2">
<name>李四</name>
<age>24</age>
</student>
</students>

上边是已经准备好的student.xml文件

public class Student {
    private String id;
    private String name;
    private int  age;

    public Student() {
    }

    public Student(String id, String name, int age) {
        this.id = id;
        this.name = name;
        this.age = age;
    }

    public String getId() {
        return id;
    }

    public void setId(String id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "Student{" +
                "id='" + id + '\'' +
                ", name='" + name + '\'' +
                ", age='" + age + '\'' +
                '}';
    }
}
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

import java.io.File;
import java.util.ArrayList;
import java.util.List;

/**
 * 利用 dom4j解析文件
 */
public class XmlParse {
    public static void main(String[] args) throws DocumentException {
        //1.获取一个解析器对象
        SAXReader saxReader = new SAXReader();
        //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
        Document document = saxReader.read(new File("xml\\student.xml"));
        //3.获取到根标签
        Element rootElement = document.getRootElement();
        //4.通过根标签来获取student标签
        //elements():可以获取调用者所有的子标签。会把这些子标签放到一个集合中返回
        //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集合中并返回。
        //List list = rootElement.elements();
        List <Element>studentElements =  rootElement.elements("student");
        //System.out.println(list.size());

        //用来装学生对象
        ArrayList<Student> list = new ArrayList<>();
        //5.遍历集合,得到每一个 student 标签
        for (Element element : studentElements) {
            //element依次表示每一个student标签

            //获取id这个属性
            Attribute attribute = element.attribute("id");

            //获取id的属性值
            String id = attribute.getValue();

            //获取 name 标签
            //element("标签名"):获取调用者指定的子标签
            Element nameElement = element.element("name");
            //获取这个标签的标签体内容
            String name = nameElement.getText();

            //获取age标签

            Element ageElement = element.element("age");
            String age = ageElement.getText();

//            System.out.println(id);
//            System.out.println(name);
//            System.out.println(age);

            Student s = new Student(id,name,Integer.parseInt(age));
            list.add(s);

        }

        //遍历操作
        for (Student student : list) {
            System.out.println(student);

        }
    }
}

1.5DTD约束

  • 什么是约束
    用来限定xml文件中可使用的标签以及属性

  • 约束的分类

    • DTD
    • schema
  • 编写DTD约束

    • 步骤
    1. 创建一个文件,这个文件的后缀名为.dtd
    2. 看xml文件中使用了哪些元素 <!ELEMENT> 可以定义元素
    3. 判断元素是简单元素还是复杂元素
      简单元素:没有子元素。 复杂元素:有子元素的元素;
    • 代码实现
<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
  • 引入DTD约束
    • 引入DTD约束的三种方法
      • 引入本地 dtd
      • 在 xml 文件内部引入
      • 引入网络 dtd
    • 代码实现
      • 引入本地 DTD 约束
// 这是persondtd.dtd文件中的内容,已经提前写好
<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
// 在person1.xml文件中引入persondtd.dtd约束
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons SYSTEM 'persondtd.dtd'>
<persons>
<person>
<name>张三</name>
<age>23</age>
</person>
</persons>

在 xml 文件内部引入

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons [
<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
]>
<persons>
<person>
<name>张三</name>
<age>23</age>
</person>
</persons>

引入网络 dtd

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons PUBLIC "dtd文件的名称" "dtd文档的URL">
<persons>
<person>
<name>张三</name>
<age>23</age>
</person>
</persons>

  • DTD语法
    • 定义元素
      定义一个元素的格式为: 简单元素:
      EMPTY: 表示标签体为空
      ANY: 表示标签体可以为空也可以不为空
      PCDATA: 表示该元素的内容部分为字符串
      复杂元素: 直接写子元素名称. 多个子元素可以使用",“或者”|"隔开; ","表示定义子元素的顺序 ; “|”: 表示子元素只能出现任意一个 "?"零次或一次, "+"一次或多次, "*"零次或多次;如果不写则表示出现一次
      在这里插入图片描述
  • 定义属性
    格式
    定义一个属性的格式为: 属性的类型: CDATA类型:普通的字符串
    属性的约束:
    // #REQUIRED: 必须的 // #IMPLIED: 属性不是必需的 // #FIXED value:属性值是固定的
  • 代码实现
<!ELEMENT persons (person+)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ATTLIST person id CDATA #REQUIRED>
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons SYSTEM 'persondtd.dtd'>
<persons>
<person id="001">
<name>张三</name>
<age>23</age>
</person>
<person id = "002">
<name>张三</name>
<age>23</age>
</person>
</persons>

1.6schema约束

  • schema和dtd的区别

    1. schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd
    2. 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于
      java包名)
    3. dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个
      数据类型
    4. schema 语法更加的复杂
      在这里插入图片描述
  • 编写schema约束

    • 步骤
      1,创建一个文件,这个文件的后缀名为.xsd。
      2,定义文档声明
      3,schema文件的根标签为:< schema>< /schema>
      4,在中定义属性: xmlns= http://www.w3.org/2001/XMLSchema
      5,在中定义属性 :targetNamespace =唯一的url地址,指定当前这个schema文件的名称空间。
      6,在中定义属性: elementFormDefault="qualified“,表示当前schema文件是一个质量良好的文件。
      7,通过element定义元素
      8,判断当前元素是简单元素还是复杂元素

    在这里插入图片描述

    • 代码实现
<?xml version="1.0" encoding="UTF-8" ?>
<schema
xmlns="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.itheima.cn/javase"
elementFormDefault="qualified"
>
<!--定义persons复杂元素-->
<element name="persons">
<complexType>
<sequence>
<!--定义person复杂元素-->
<element name = "person">
<complexType>
<sequence>
<!--定义name和age简单元素-->
<element name = "name" type = "string">
</element>
<element name = "age" type = "string">
</element>
</sequence>
</complexType>
</element>
</sequence>
</complexType>
</element>
</schema>

  • 引入schema约束
    • 步骤
      1,在根标签上定义属性xmlns=" http://www.w3.org/2001/XMLSchema-instance "
      2,通过xmlns引入约束文件的名称空间
      3,给某一个xmlns属性添加一个标识,用于区分不同的名称空间 格式为: xmlns:标识=“名称空间地址” ,标识可以是任意的,但是一般取值都是xsi
      4,通过xsi:schemaLocation指定名称空间所对应的约束文件路径 格式为:xsi:schemaLocation = "名称 空间url 文件路径“

    • 代码实现

<?xml version="1.0" encoding="UTF-8" ?>
<persons
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://www.itheima.cn/javase"
xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
>
<person>
<name>张三</name>
<age>23</age>
</person>
</persons>
  • schema约束定义属性
    • 代码示例
<?xml version="1.0" encoding="UTF-8" ?>
<schema
xmlns="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.itheima.cn/javase"
elementFormDefault="qualified"
>
<!--定义persons复杂元素-->
<element name="persons">
<complexType>
<sequence>
<!--定义person复杂元素-->
<element name = "person">
<complexType>
<sequence>
<!--定义name和age简单元素-->
<element name = "name" type = "string">
</element>
<element name = "age" type = "string">
</element>
</sequence>
<!--定义属性,required( 必须的)/optional( 可选的)--
>
<attribute name="id" type="string"
use="required"></attribute>
</complexType>
</element>
</sequence>
</complexType>
</element>
</schema>
<?xml version="1.0" encoding="UTF-8" ?>
<persons
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://www.itheima.cn/javase"
xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
>
<person id="001">
<name>张三</name>
<age>23</age>
</person>
</persons>
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

续写青春.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值