XML介绍

最新推荐文章于 2024-08-23 13:28:50 发布

懒懒张187

最新推荐文章于 2024-08-23 13:28:50 发布

阅读量1.3k

点赞数

文章标签： xml

本文链接：https://blog.csdn.net/m0_48811221/article/details/122875861

版权

XML

什么是XML

XML 指可扩展标记语言（EXtensible Markup Language）
- 标记:也叫标签,有固定的使用格式
  - <开始标签>标签体</结束标签>
- 可扩展:标签的名称自己定义,随意
  - <Person>aaa</Person>
  - <afdsafdsafdsafsa>adfadsfads</afdsafdsafdsafsa>
  - <a>aaaa</a>
XML 是 W3C (万维网联盟)的推荐标准

W3C在1988年2月发布1.0版本，2004年2月又发布1.1版本，单因为1.1版本不能向下兼容1.0版本，所以1.1没有人用。同时，在2004年2月W3C又发布了1.0版本的第三版。我们要学习的还是1.0版本。

XML和HXML的主要差异

XML:
- 作用:存储数据,会获取出xml中存储的数据使用
- 可扩展的,标签的名称可以自定义
HTML:
- 作用:展示数据,给别人看的(页面)
- 标签的名称都是固定的

XML的组成元素

XML文件中常见的组成元素有:文档声明、元素、属性、注释、转义字符、字符区。

Xml文件扩展名必须为xml

XML语法（重点）

1.）文档声明

<?xml version="1.0"  encoding="UTF-8" ?>

使用IDE创建xml文件时就带有文档声明.
文档声明必须为<?xml开头，以？>结束
文档声明必须从文档的0行0列位置开始
文档声明中常见的两个属性：
- version：指定XML文档版本。必须属性，这里一般选择1.0；
- enconding：指定当前文档的编码，可选属性，默认值是utf-8；

2.）元素element

注意：元素就是标签

格式1:<person>aaaa</person>
格式2:<person/>  空元素 自闭和标签

元素是XML文档中最重要的组成部分；
普通元素的结构由开始标签、元素体、结束标签组成。
元素体：元素体可以是元素，也可以是文本，例如：<person><name>张三</name></person>
空元素：空元素只有开始标签，而没有结束标签，但元素必须自己闭合，例如：<sex/>
元素命名
- 区分大小写
- 不能使用空格，不能使用冒号
- 不建议以XML、xml、Xml开头
- 不能以数字开头
格式化良好的XML文档，有且仅有一个根元素。

<?xml version="1.0" encoding="UTF-8" ?>
<beans>
    <bean>
        <property></property>
        <property></property>
    </bean>
    <bean>
        <property/>
    </bean>
</beans>

3.）属性attribute

格式：

<person></person>
<person  id="110" age="18"  name="aaa" ></person>
<person id="110" ></person>

属性是元素的一部分，它必须出现在元素的开始标签中
属性的定义格式：属性名=“属性值”，其中属性值必须使用单引或双引号括起来
一个元素可以有0~N个属性，但一个元素中不能出现同名属性
属性名不能使用空格 , 不要使用冒号等特殊字符，且必须以字母开头
属性不区分先后顺序,写在前边和写在后边的作用是一样的

<?xml version="1.0" encoding="UTF-8" ?>
<beans>
<bean className="com.llz.demo01.Person">
    <property age="18" name='jack'></property>
    <property name="rose" age="18"></property>
</bean>
<bean className="com.llz.demo01.Student">
    <property name="tom" age="5"></property>
    <property name="jerry" age="3"></property>
</bean>
</beans>

4.）注释

<!--
    xml文件中的注释:
        可以在注释中写一个内容,对代码进行解释说明,方便程序员看
        不会被xml解析器解析(不会被读取出来)
    添加|删除注释的快捷键:
        ctrl+shift+/
 -->
<!--这是定义一个根元素-->
<beans>
    <!--<bean className="com.llz.demo01.Person">
        <property age="18" name='jack'></property>
        <property name="rose" age="18"></property>
    </bean>-->
    <bean className="com.llz.demo01.Student">
        <!--<property name="tom" age="5"></property>-->
        <property name="jerry" age="3"></property>
    </bean>
</beans>

5.）转义字符

Java中的转义字符（了解）

/*
    java中的转义字符: \
    作用:
        1.可以把普通的字符转义为有特殊含义的字符
        2.可以把有特殊含义的字符转换为普通的字符
 */
public class Demo01 {
    public static void main(String[] args) {
        char c1 = 'a';
        System.out.println(c1);

        //1.可以把普通的字符转义为有特殊含义的字符
        char c2 = 't';
        System.out.println(c2);

        System.out.println("你好t我好t大家好");
        System.out.println("你好\t我好\t大家好");//把普通的t转义有有特殊含义的制表符 tab


        //2.可以把有特殊含义的字符转换为普通的字符
        char c3 = '\'';//把有特殊含义的'转换为普通'
        System.out.println(c3);//'
        System.out.println("c:\\a.txt");//把有特殊含义的\使用转义字符编程普通的\

    }
}

XML文件中的转义字符
XML中的转义字符与HTML一样。因为很多符号已经被文档结构所使用，所以在元素体或属性值中想使用这些符号就必须使用转义字符（也叫实体字符），例如：">"、"<"、"’"、"""、"&"。

| < | < | 小于 |
| > | > | 大于 |
| " | " | 双引号 |
| ’ | ' | 单引号 |
| & | & | 和号 |

XML文件的约束

在XML技术里，可以编写一个文档来约束一个XML文档的书写规范，这称之为XML约束。

常见的xml约束：DTD、Schema

学习约束文档的目的:根据约束文档写出xml文档

1.)dtd约束文档

DTD是文档类型定义（Document Type Definition）。

DTD约束的作用:约束xml文档中元素属性如何编写
在这里插入图片描述

基本使用（重点）

bean.dtd

<?xml version="1.0" encoding="UTF-8"?>
<!--
	模拟spring规范，如果开发人员需要在xml使用当前DTD约束，必须包括DOCTYPE。
	格式如下：
	<!DOCTYPE beans SYSTEM "bean.dtd">
-->
<!ELEMENT beans (bean*,import*) >
<!ELEMENT bean (property*)>
<!ELEMENT property (#PCDATA)>

<!ELEMENT import (#PCDATA)>

<!ATTLIST bean id CDATA #REQUIRED
			   className CDATA #REQUIRED
>

<!ATTLIST property name CDATA #REQUIRED
			   	   value CDATA #REQUIRED
>

<!ATTLIST import resource CDATA #REQUIRED>

复制dtd约束文档到模块中,一般都和xml文档放在同一个文件夹下
在这里插入图片描述
demo01-dtd.xml

<?xml version="1.0" encoding="UTF-8" ?>
<!--
    dtd约束文档的使用步骤:
        1.在每个dtd约束文档中都有一个以<!DOCTYPE开头的代码,复制到xml文档中
            <!DOCTYPE beans SYSTEM "bean.dtd">
            a.<!DOCTYPE:是dtd约束文档的固定声明格式
            b.beans:dtd约束文档,约束在xml文件中写根元素必须叫beans
            c.SYSTEM:系统的意思,说明dtd约束文档来源于本地的操作系统中
            d."bean.dtd":dtd约束文档的路径
                一般都会把约束文档和xml文件放在同一个文件夹下
                所以可以直接使用相对路径
       2.根据约束文档的要求,写出根元素
       3.在根元素中,根据提示写出其它的元素(写<就有提示我们可以写什么内容)
-->
<!DOCTYPE beans SYSTEM "bean.dtd">
<beans>
    <bean id="" className="">
        <property name="" value="">
            <!--在dtd文档中写<没有提示,说明只能写文本了-->
            adfadsfa普通文本
        </property>
        <property name="" value="">1</property>
        <property name="" value="">2</property>
        <property name="" value="">3</property>
        <property name="" value="">4</property>
    </bean>
    <bean id="" className=""></bean>
    <bean id="" className=""></bean>
    <bean id="" className=""></bean>
    <bean id="" className=""></bean>
    <import resource=""></import>
    <import resource="">
        只能写文本
    </import>
    <import resource=""></import>
    <import resource=""></import>
    <import resource=""></import>
</beans>

2.）scheme约束

概述
Schema 语言也可作为 XSD（XML Schema Definition）。

Schema 比DTD强大，是DTD代替者。

Schema 本身也是XML文档，但是Schema文档扩展名为xsd，而不是xml。

Schema 功能更强大，数据类型约束更完善。
Schema支持命名空间
在这里插入图片描述

schema基本使用（重点）

<?xml version="1.0" encoding="UTF-8"?>
<!-- 
	模拟spring规范，如果开发人员需要在xml使用当前Schema约束，必须包括指定命名空间。
	格式如下：
	<beans xmlns="http://www.baidu.cn/bean"
	   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	   xsi:schemaLocation="http://www.weibo.cn/bean bean-schema.xsd"
	>
-->
<schema xmlns="http://www.w3.org/2001/XMLSchema" 
		targetNamespace="http://www.baiwu.cn/bean"
		xmlns:xsd="http://www.w3.org/2001/XMLSchema"
		xmlns:tns="http://www.weibo.cn/bean" 
		elementFormDefault="qualified">
	<element name="beans">
		<complexType>
			<choice minOccurs="0" maxOccurs="3">
				<element name="bean">
					<complexType>
						<sequence minOccurs="0" maxOccurs="unbounded">
							<element name="property">
								<complexType>
									<attribute name="name" use="optional"></attribute>
									<attribute name="value" use="required"></attribute>
								</complexType>
							</element>
						</sequence>
						<attribute name="id" use="required"></attribute>
						<attribute name="className" use="required"></attribute>
					</complexType>
				</element>
				<element name="import">
					<complexType>
						<attribute name="resource" use="required"></attribute>
					</complexType>
				</element>
			</choice>
		</complexType>
	</element>
</schema>

demo01-schema.xml

<?xml version="1.0" encoding="UTF-8" ?>
<!--
    schema约束文档使用步骤:
        1.在schema约束文档中有一个根元素的开始标签,复制到xml文档中,添加结束标签
        2.在根元素中,根据提示(<出现提示),写出其他的元素和属性
-->
<beans xmlns="http://www.baidu.cn/bean"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xsi:schemaLocation="http://www.weibo.cn/bean bean-schema.xsd"
>
    <!--
        写元素的时候,元素的标签体,写任何的内容都报错,说明这个元素是一个自闭和标签
    -->
    <import resource=""/>
    <import resource=""/>
    <import resource=""/>
    <bean id="" className=""></bean>
    <import resource=""></import>
    <bean id="" className="">
        <property value="" name="可选的">嘻嘻</property>
        <property value=""/>
        <property value=""/>
        <property value=""/>
    </bean>
</beans>

XML解析

当将数据存储在XML后，我们就希望通过程序获取XML的内容。使用IO流是可以完成的，不过要非常繁琐的操作才可以完成，且开发中会遇到不同问题（只读、读写）。人们为不同问题提供不同的解析方式，使用不同的解析器进行解析，方便开发人员操作XML。

解析方式和解析器

开发中比较常见的解析方式有三种，如下：
1. DOM：要求解析器把整个XML文档装载到内存，并解析成一个Document对象
  
  a）优点：元素与元素之间保留结构关系，故可以进行增删改查操作。
  
  b）缺点：XML文档过大，可能出现内存溢出
2. SAX：是一种速度更快，更有效的方法。她逐行扫描文档，一边扫描一边解析。并以事件驱动的方式进行具体解析，每执行一行，都触发对应的事件。
  
  a）优点：处理速度快，可以处理大文件
  
  b）缺点：只能读，逐行后将释放资源，解析操作繁琐。
3. PULL：Android内置的XML解析方式，类似SAX。
解析器，就是根据不同的解析方式提供具体实现。有的解析器操作过于繁琐，为了方便开发人员，又提供易于操作的解析开发包。

常见的解析开发包
JAXP：sun公司提供支持DOM和SAX开发包
Dom4j：比较简单的的解析开发包(常用)
JDom：与Dom4j类似
Jsoup：功能强大DOM方式的XML解析开发包，尤其对HTML解析更加方便。

DOM解析原理及模型结构

在这里插入图片描述

使用dom4j解析XML文件（重点）

<?xml version="1.0" encoding="UTF-8"?>
<beans>
	<bean id="001" className="cn.itcast.demo.User">
		<property name="user" value="jack">文本1</property>
		<property name="user" value="rose">文本2</property>
	</bean>
	<bean id="002" className="cn.itcast.demo.Admin">
		<property name="user" value="admin">文本3</property>
		<property name="user" value="write">文本4</property>
	</bean>
</beans>

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

import java.util.List;
/*
    使用dom4j解析xml文件
        获取xml文件中的元素,属性和文本
    解析步骤:
        1.导入dom4j的jar包
        2.创建dom4j核心类对象SAXReader
        3.使用SAXReader对象中的方法read,读取xml文件到内存中,生成Document对象
        4.使用Document对象中的方法getRootElement获取根元素beans
        5.使用根元素Element对象中的方法elements获取根元素benns下边所有的子元素bean,多个bean元素存储到一个List集合中返回
        6.遍历List集合,获取每一个bean元素
        7.使用bean元素Element中的方法attributeValue,根据属性名获取属性值(id,className)
        8.使用bean元素Element中的方法elements获取bean元素下边的所有子元素property元素,多个property元素存储到一个List集合中返回
        9.遍历List集合,获取每一个property元素
        10.使用property元素Element中的方法attributeValue,根据属性名获取属性值(name,value)
        11.使用property元素Element中的方法getText,获取property元素上的文本(标签体)
 */
public class Demo01UseDom4jParseXML {
    public static void main(String[] args) throws DocumentException {
        //1.导入dom4j的jar包
        //2.创建dom4j核心类对象SAXReader
        SAXReader sax = new SAXReader();
        //3.使用SAXReader对象中的方法read,读取xml文件到内存中,生成Document对象
        Document document = sax.read("day21\\beans.xml");
        //4.使用Document对象中的方法getRootElement获取根元素beans
        Element rootElement = document.getRootElement();
        System.out.println(rootElement.getName());
        //5.使用根元素Element对象中的方法elements获取根元素benns下边所有的子元素bean,多个bean元素存储到一个List集合中返回
        List<Element> beanElementList = rootElement.elements();
        //6.遍历List集合,获取每一个bean元素
        for (Element beanElement : beanElementList) {
            System.out.println("\t"+beanElement.getName());
            //7.使用bean元素Element中的方法attributeValue,根据属性名获取属性值(id,className)
            String id = beanElement.attributeValue("id");
            String className = beanElement.attributeValue("className");
            System.out.println("\t\tbean元素的属性id:"+id);
            System.out.println("\t\tbean元素的属性className:"+className);
            //8.使用bean元素Element中的方法elements获取bean元素下边的所有子元素property元素,多个property元素存储到一个List集合中返回
            List<Element> propertyElementList = beanElement.elements();
            //9.遍历List集合,获取每一个property元素
            for (Element propertyElement : propertyElementList) {
                System.out.println("\t\t\t"+propertyElement.getName());
                //10.使用property元素Element中的方法attributeValue,根据属性名获取属性值(name,value)
                String name = propertyElement.attributeValue("name");
                String value = propertyElement.attributeValue("value");
                System.out.println("\t\t\t\tproperty元素的属性name:"+name);
                System.out.println("\t\t\t\tproperty元素的属性value:"+value);
                //11.使用property元素Element中的方法getText,获取property元素上的文本(标签体)
                String text = propertyElement.getText();
                System.out.println("\t\t\t\tproperty元素的文本:"+text);
            }
        }
    }
}

结果：

beans
	bean
		bean元素的属性id:001
		bean元素的属性className:cn.itcast.demo.User
			property
				property元素的属性name:user
				property元素的属性value:jack
				property元素的文本:文本1
			property
				property元素的属性name:user
				property元素的属性value:rose
				property元素的文本:文本2
	bean
		bean元素的属性id:002
		bean元素的属性className:cn.itcast.demo.Admin
			property
				property元素的属性name:user
				property元素的属性value:admin
				property元素的文本:文本3
			property
				property元素的属性name:user
				property元素的属性value:write
				property元素的文本:文本4

使用xpath和dom4j快读定位解析xml文件（重点）

beans.xml

<?xml version="1.0" encoding="UTF-8"?>
<beans>
    <bean id="001" className="cn.itcast.demo.User">
        <property name="user" value="jack">文本1</property>
        <property name="user" value="rose">文本2</property>
        <bean id="005" className="cn.itcast.demo.Animal">
            <property name="user" value="小猫">文本9</property>
            <property name="user" value="小狗">文本10</property>
        </bean>
    </bean>
    <bean id="002" className="cn.itcast.demo.Admin">
        <property name="user" value="admin">文本3</property>
        <property name="user" value="write">文本4</property>
    </bean>
    <bean id="003" >
        <property name="user" value="张三">文本5</property>
        <property name="user" value="李四">文本6</property>
    </bean>
    <bean id="004" className="cn.itcast.demo.Student">
        <property name="user" value="王五">文本7</property>
        <property name="user" value="赵六">文本8</property>
    </bean>
</beans>

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;

import java.util.List;

/*
    使用xpath和dom4j快读定位解析xml文件
    使用前提:
        xpath使用dom4j中的方法,必须先引入dom4j的jar包
    使用步骤:
        1.导入dom4j和xpath的jar包
        2.创建dom4j核心类对象SAXReader
        3.使用SAXReader对象中的方法read,读取xml文档到内存中,生成Document对象
        4.使用Document对象中的方法selectNodes|selectSingleNode解析xml文件
            List selectNodes("xpath表达式") 获取符合表达式的元素集合
            Element selectSingleNode("xpath表达式") 获取符合表达式的唯一元素
            Element extends Node
    常用的xpath表达式:
        第一种查询形式:
            //*:获取所有的元素
        第二种查询方式:
            /AAA/BBB/CCC:表示一层一层获取,获取AAA里边BBB里边的CCC
            /beans/bean
        第三种查询方法:
            //BBB:表示获取和BBB名称相同的,只要是BBB都能获取到
            //bean
        第四种查询方式:
            //BBB[1]:表示获取第一个BBB元素
            //BBB[last()]:表示获取最后一个BBB元素
        第五种查询方式:
            //BBB[@id]:表示只要BBB元素上面有id的属性都能获取到
        第六种查询方式:
            //BBB[@id='002'] :表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是002
 */
public class Demo02UseXpathAndDom4jParseXML {
    public static void main(String[] args) throws DocumentException {
        //1.导入dom4j和xpath的jar包
        //2.创建dom4j核心类对象SAXReader
        SAXReader sax = new SAXReader();
        //3.使用SAXReader对象中的方法read,读取xml文档到内存中,生成Document对象
        Document document = sax.read("day21\\beans.xml");
        //4.使用Document对象中的方法selectNodes|selectSingleNode解析xml文件
        //获取beans下边所有的bean
        List<Element> list01 = document.selectNodes("/beans/bean");
        for (Element beanElement : list01) {
            System.out.println(beanElement.getName()+"\t"+beanElement.attributeValue("id"));
        }
        System.out.println("--------------------");
        //获取beans下边bean中的property
        List<Element> list02 = document.selectNodes("/beans/bean/property");
        for (Element propertyElement : list02) {
            System.out.println(propertyElement.getName()+"\t"+propertyElement.attributeValue("value"));
        }
        System.out.println("--------------------");
        //获取xml文档中所有的元素
        List<Element> list03 = document.selectNodes("//*");
        for (Element element : list03) {
            System.out.println(element.getName());
        }
        System.out.println("--------------------");
        //获取所有bean元素中的第一个bean元素
        Element firstBeanElement = (Element)document.selectSingleNode("//bean[1]");
        System.out.println(firstBeanElement.getName()+"\t"+firstBeanElement.attributeValue("id"));
        //获取所有bean元素中的第最后一个bean元素
        Element lastBeanElement = (Element)document.selectSingleNode("//bean[last()]");
        System.out.println(lastBeanElement.getName()+"\t"+lastBeanElement.attributeValue("id"));
        System.out.println("--------------------");
        //获取所有bean元素中有className属性的
        List<Element> list04 = document.selectNodes("//bean[@className]");
        for (Element element : list04) {
            System.out.println(element.getName()+"\t"+element.attributeValue("id"));
        }
        System.out.println("--------------------");
        //获取所有property元素中有value属性的,并且value属性值是小猫的
        Element catElement = (Element)document.selectSingleNode("//property[@value='小猫']");
        System.out.println(catElement.getName()+"\t"+catElement.attributeValue("value"));
    }
}