XML
什么是XML
-
XML 指可扩展标记语言(EXtensible Markup Language)
- 标记:也叫标签,有固定的使用格式
<开始标签>标签体</结束标签>
- 可扩展:标签的名称自己定义,随意
<Person>aaa</Person>
<afdsafdsafdsafsa>adfadsfads</afdsafdsafdsafsa>
<a>aaaa</a>
- 标记:也叫标签,有固定的使用格式
-
XML 是 W3C (万维网联盟)的推荐标准
W3C在1988年2月发布1.0版本,2004年2月又发布1.1版本,单因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在2004年2月W3C又发布了1.0版本的第三版。我们要学习的还是1.0版本。
XML和HXML的主要差异
- XML:
- 作用:存储数据,会获取出xml中存储的数据使用
- 可扩展的,标签的名称可以自定义
- HTML:
- 作用:展示数据,给别人看的(页面)
- 标签的名称都是固定的
XML的组成元素
XML文件中常见的组成元素有:文档声明、元素、属性、注释、转义字符、字符区。
Xml文件扩展名必须为xml
XML语法(重点)
1.)文档声明
<?xml version="1.0" encoding="UTF-8" ?>
- 使用IDE创建xml文件时就带有文档声明.
- 文档声明必须为<?xml开头,以?>结束
- 文档声明必须从文档的0行0列位置开始
- 文档声明中常见的两个属性:
- version:指定XML文档版本。必须属性,这里一般选择1.0;
- enconding:指定当前文档的编码,可选属性,默认值是utf-8;
2.)元素element
注意:元素就是标签
格式1:<person>aaaa</person>
格式2:<person/> 空元素 自闭和标签
- 元素是XML文档中最重要的组成部分;
- 普通元素的结构由开始标签、元素体、结束标签组成。
- 元素体:元素体可以是元素,也可以是文本,例如:
<person><name>张三</name></person>
- 空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合,例如:
<sex/>
- 元素命名
- 区分大小写
- 不能使用空格,不能使用冒号
- 不建议以XML、xml、Xml开头
- 不能以数字开头
- 格式化良好的XML文档,有且仅有一个根元素。
<?xml version="1.0" encoding="UTF-8" ?>
<beans>
<bean>
<property></property>
<property></property>
</bean>
<bean>
<property/>
</bean>
</beans>
3.)属性attribute
格式:
<person></person>
<person id="110" age="18" name="aaa" ></person>
<person id="110" ></person>
- 属性是元素的一部分,它必须出现在元素的开始标签中
- 属性的定义格式:属性名=“属性值”,其中属性值必须使用单引或双引号括起来
- 一个元素可以有0~N个属性,但一个元素中不能出现同名属性
- 属性名不能使用空格 , 不要使用冒号等特殊字符,且必须以字母开头
- 属性不区分先后顺序,写在前边和写在后边的作用是一样的
<?xml version="1.0" encoding="UTF-8" ?>
<beans>
<bean className="com.llz.demo01.Person">
<property age="18" name='jack'></property>
<property name="rose" age="18"></property>
</bean>
<bean className="com.llz.demo01.Student">
<property name="tom" age="5"></property>
<property name="jerry" age="3"></property>
</bean>
</beans>
4.)注释
<!--
xml文件中的注释:
可以在注释中写一个内容,对代码进行解释说明,方便程序员看
不会被xml解析器解析(不会被读取出来)
添加|删除注释的快捷键:
ctrl+shift+/
-->
<!--这是定义一个根元素-->
<beans>
<!--<bean className="com.llz.demo01.Person">
<property age="18" name='jack'></property>
<property name="rose" age="18"></property>
</bean>-->
<bean className="com.llz.demo01.Student">
<!--<property name="tom" age="5"></property>-->
<property name="jerry" age="3"></property>
</bean>
</beans>
5.)转义字符
Java中的转义字符(了解)
/*
java中的转义字符: \
作用:
1.可以把普通的字符转义为有特殊含义的字符
2.可以把有特殊含义的字符转换为普通的字符
*/
public class Demo01 {
public static void main(String[] args) {
char c1 = 'a';
System.out.println(c1);
//1.可以把普通的字符转义为有特殊含义的字符
char c2 = 't';
System.out.println(c2);
System.out.println("你好t我好t大家好");
System.out.println("你好\t我好\t大家好");//把普通的t转义有有特殊含义的制表符 tab
//2.可以把有特殊含义的字符转换为普通的字符
char c3 = '\'';//把有特殊含义的'转换为普通'
System.out.println(c3);//'
System.out.println("c:\\a.txt");//把有特殊含义的\使用转义字符编程普通的\
}
}
XML文件中的转义字符
XML中的转义字符与HTML一样。因为很多符号已经被文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符(也叫实体字符),例如:">"、"<"、"’"、"""、"&"。
| < | <
| 小于 |
| > | >
| 大于 |
| " | "
| 双引号 |
| ’ | '
| 单引号 |
| & | &
| 和号 |
XML文件的约束
在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。
常见的xml约束:DTD、Schema
学习约束文档的目的:根据约束文档写出xml文档
1.)dtd约束文档
DTD是文档类型定义(Document Type Definition)。
DTD约束的作用:约束xml文档中元素属性如何编写
基本使用(重点)
bean.dtd
<?xml version="1.0" encoding="UTF-8"?>
<!--
模拟spring规范,如果开发人员需要在xml使用当前DTD约束,必须包括DOCTYPE。
格式如下:
<!DOCTYPE beans SYSTEM "bean.dtd">
-->
<!ELEMENT beans (bean*,import*) >
<!ELEMENT bean (property*)>
<!ELEMENT property (#PCDATA)>
<!ELEMENT import (#PCDATA)>
<!ATTLIST bean id CDATA #REQUIRED
className CDATA #REQUIRED
>
<!ATTLIST property name CDATA #REQUIRED
value CDATA #REQUIRED
>
<!ATTLIST import resource CDATA #REQUIRED>
复制dtd约束文档到模块中,一般都和xml文档放在同一个文件夹下
demo01-dtd.xml
<?xml version="1.0" encoding="UTF-8" ?>
<!--
dtd约束文档的使用步骤:
1.在每个dtd约束文档中都有一个以<!DOCTYPE开头的代码,复制到xml文档中
<!DOCTYPE beans SYSTEM "bean.dtd">
a.<!DOCTYPE:是dtd约束文档的固定声明格式
b.beans:dtd约束文档,约束在xml文件中写根元素必须叫beans
c.SYSTEM:系统的意思,说明dtd约束文档来源于本地的操作系统中
d."bean.dtd":dtd约束文档的路径
一般都会把约束文档和xml文件放在同一个文件夹下
所以可以直接使用相对路径
2.根据约束文档的要求,写出根元素
3.在根元素中,根据提示写出其它的元素(写<就有提示我们可以写什么内容)
-->
<!DOCTYPE beans SYSTEM "bean.dtd">
<beans>
<bean id="" className="">
<property name="" value="">
<!--在dtd文档中写<没有提示,说明只能写文本了-->
adfadsfa普通文本
</property>
<property name="" value="">1</property>
<property name="" value="">2</property>
<property name="" value="">3</property>
<property name="" value="">4</property>
</bean>
<bean id="" className=""></bean>
<bean id="" className=""></bean>
<bean id="" className=""></bean>
<bean id="" className=""></bean>
<import resource=""></import>
<import resource="">
只能写文本
</import>
<import resource=""></import>
<import resource=""></import>
<import resource=""></import>
</beans>
2.)scheme约束
概述
Schema 语言也可作为 XSD(XML Schema Definition)。
Schema 比DTD强大,是DTD代替者。
Schema 本身也是XML文档,但是Schema文档扩展名为xsd,而不是xml。
Schema 功能更强大,数据类型约束更完善。
Schema支持命名空间
schema基本使用(重点)
<?xml version="1.0" encoding="UTF-8"?>
<!--
模拟spring规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。
格式如下:
<beans xmlns="http://www.baidu.cn/bean"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.weibo.cn/bean bean-schema.xsd"
>
-->
<schema xmlns="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.baiwu.cn/bean"
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
xmlns:tns="http://www.weibo.cn/bean"
elementFormDefault="qualified">
<element name="beans">
<complexType>
<choice minOccurs="0" maxOccurs="3">
<element name="bean">
<complexType>
<sequence minOccurs="0" maxOccurs="unbounded">
<element name="property">
<complexType>
<attribute name="name" use="optional"></attribute>
<attribute name="value" use="required"></attribute>
</complexType>
</element>
</sequence>
<attribute name="id" use="required"></attribute>
<attribute name="className" use="required"></attribute>
</complexType>
</element>
<element name="import">
<complexType>
<attribute name="resource" use="required"></attribute>
</complexType>
</element>
</choice>
</complexType>
</element>
</schema>
demo01-schema.xml
<?xml version="1.0" encoding="UTF-8" ?>
<!--
schema约束文档使用步骤:
1.在schema约束文档中有一个根元素的开始标签,复制到xml文档中,添加结束标签
2.在根元素中,根据提示(<出现提示),写出其他的元素和属性
-->
<beans xmlns="http://www.baidu.cn/bean"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.weibo.cn/bean bean-schema.xsd"
>
<!--
写元素的时候,元素的标签体,写任何的内容都报错,说明这个元素是一个自闭和标签
-->
<import resource=""/>
<import resource=""/>
<import resource=""/>
<bean id="" className=""></bean>
<import resource=""></import>
<bean id="" className="">
<property value="" name="可选的">嘻嘻</property>
<property value=""/>
<property value=""/>
<property value=""/>
</bean>
</beans>
XML解析
当将数据存储在XML后,我们就希望通过程序获取XML的内容。使用IO流是可以完成的,不过要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,使用不同的解析器进行解析,方便开发人员操作XML。
解析方式和解析器
-
开发中比较常见的解析方式有三种,如下:
-
DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象
a)优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b)缺点:XML文档过大,可能出现内存溢出
-
SAX:是一种速度更快,更有效的方法。她逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都触发对应的事件。
a)优点:处理速度快,可以处理大文件
b)缺点:只能读,逐行后将释放资源,解析操作繁琐。
-
PULL:Android内置的XML解析方式,类似SAX。
-
-
解析器,就是根据不同的解析方式提供具体实现。有的解析器操作过于繁琐,为了方便开发人员,又提供易于操作的解析开发包。
常见的解析开发包 -
JAXP:sun公司提供支持DOM和SAX开发包
-
Dom4j:比较简单的的解析开发包(常用)
-
JDom:与Dom4j类似
-
Jsoup:功能强大DOM方式的XML解析开发包,尤其对HTML解析更加方便。
DOM解析原理及模型结构
使用dom4j解析XML文件(重点)
<?xml version="1.0" encoding="UTF-8"?>
<beans>
<bean id="001" className="cn.itcast.demo.User">
<property name="user" value="jack">文本1</property>
<property name="user" value="rose">文本2</property>
</bean>
<bean id="002" className="cn.itcast.demo.Admin">
<property name="user" value="admin">文本3</property>
<property name="user" value="write">文本4</property>
</bean>
</beans>
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import java.util.List;
/*
使用dom4j解析xml文件
获取xml文件中的元素,属性和文本
解析步骤:
1.导入dom4j的jar包
2.创建dom4j核心类对象SAXReader
3.使用SAXReader对象中的方法read,读取xml文件到内存中,生成Document对象
4.使用Document对象中的方法getRootElement获取根元素beans
5.使用根元素Element对象中的方法elements获取根元素benns下边所有的子元素bean,多个bean元素存储到一个List集合中返回
6.遍历List集合,获取每一个bean元素
7.使用bean元素Element中的方法attributeValue,根据属性名获取属性值(id,className)
8.使用bean元素Element中的方法elements获取bean元素下边的所有子元素property元素,多个property元素存储到一个List集合中返回
9.遍历List集合,获取每一个property元素
10.使用property元素Element中的方法attributeValue,根据属性名获取属性值(name,value)
11.使用property元素Element中的方法getText,获取property元素上的文本(标签体)
*/
public class Demo01UseDom4jParseXML {
public static void main(String[] args) throws DocumentException {
//1.导入dom4j的jar包
//2.创建dom4j核心类对象SAXReader
SAXReader sax = new SAXReader();
//3.使用SAXReader对象中的方法read,读取xml文件到内存中,生成Document对象
Document document = sax.read("day21\\beans.xml");
//4.使用Document对象中的方法getRootElement获取根元素beans
Element rootElement = document.getRootElement();
System.out.println(rootElement.getName());
//5.使用根元素Element对象中的方法elements获取根元素benns下边所有的子元素bean,多个bean元素存储到一个List集合中返回
List<Element> beanElementList = rootElement.elements();
//6.遍历List集合,获取每一个bean元素
for (Element beanElement : beanElementList) {
System.out.println("\t"+beanElement.getName());
//7.使用bean元素Element中的方法attributeValue,根据属性名获取属性值(id,className)
String id = beanElement.attributeValue("id");
String className = beanElement.attributeValue("className");
System.out.println("\t\tbean元素的属性id:"+id);
System.out.println("\t\tbean元素的属性className:"+className);
//8.使用bean元素Element中的方法elements获取bean元素下边的所有子元素property元素,多个property元素存储到一个List集合中返回
List<Element> propertyElementList = beanElement.elements();
//9.遍历List集合,获取每一个property元素
for (Element propertyElement : propertyElementList) {
System.out.println("\t\t\t"+propertyElement.getName());
//10.使用property元素Element中的方法attributeValue,根据属性名获取属性值(name,value)
String name = propertyElement.attributeValue("name");
String value = propertyElement.attributeValue("value");
System.out.println("\t\t\t\tproperty元素的属性name:"+name);
System.out.println("\t\t\t\tproperty元素的属性value:"+value);
//11.使用property元素Element中的方法getText,获取property元素上的文本(标签体)
String text = propertyElement.getText();
System.out.println("\t\t\t\tproperty元素的文本:"+text);
}
}
}
}
结果:
beans
bean
bean元素的属性id:001
bean元素的属性className:cn.itcast.demo.User
property
property元素的属性name:user
property元素的属性value:jack
property元素的文本:文本1
property
property元素的属性name:user
property元素的属性value:rose
property元素的文本:文本2
bean
bean元素的属性id:002
bean元素的属性className:cn.itcast.demo.Admin
property
property元素的属性name:user
property元素的属性value:admin
property元素的文本:文本3
property
property元素的属性name:user
property元素的属性value:write
property元素的文本:文本4
使用xpath和dom4j快读定位解析xml文件(重点)
beans.xml
<?xml version="1.0" encoding="UTF-8"?>
<beans>
<bean id="001" className="cn.itcast.demo.User">
<property name="user" value="jack">文本1</property>
<property name="user" value="rose">文本2</property>
<bean id="005" className="cn.itcast.demo.Animal">
<property name="user" value="小猫">文本9</property>
<property name="user" value="小狗">文本10</property>
</bean>
</bean>
<bean id="002" className="cn.itcast.demo.Admin">
<property name="user" value="admin">文本3</property>
<property name="user" value="write">文本4</property>
</bean>
<bean id="003" >
<property name="user" value="张三">文本5</property>
<property name="user" value="李四">文本6</property>
</bean>
<bean id="004" className="cn.itcast.demo.Student">
<property name="user" value="王五">文本7</property>
<property name="user" value="赵六">文本8</property>
</bean>
</beans>
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
import java.util.List;
/*
使用xpath和dom4j快读定位解析xml文件
使用前提:
xpath使用dom4j中的方法,必须先引入dom4j的jar包
使用步骤:
1.导入dom4j和xpath的jar包
2.创建dom4j核心类对象SAXReader
3.使用SAXReader对象中的方法read,读取xml文档到内存中,生成Document对象
4.使用Document对象中的方法selectNodes|selectSingleNode解析xml文件
List selectNodes("xpath表达式") 获取符合表达式的元素集合
Element selectSingleNode("xpath表达式") 获取符合表达式的唯一元素
Element extends Node
常用的xpath表达式:
第一种查询形式:
//*:获取所有的元素
第二种查询方式:
/AAA/BBB/CCC:表示一层一层获取,获取AAA里边BBB里边的CCC
/beans/bean
第三种查询方法:
//BBB:表示获取和BBB名称相同的,只要是BBB都能获取到
//bean
第四种查询方式:
//BBB[1]:表示获取第一个BBB元素
//BBB[last()]:表示获取最后一个BBB元素
第五种查询方式:
//BBB[@id]:表示只要BBB元素上面有id的属性都能获取到
第六种查询方式:
//BBB[@id='002'] :表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是002
*/
public class Demo02UseXpathAndDom4jParseXML {
public static void main(String[] args) throws DocumentException {
//1.导入dom4j和xpath的jar包
//2.创建dom4j核心类对象SAXReader
SAXReader sax = new SAXReader();
//3.使用SAXReader对象中的方法read,读取xml文档到内存中,生成Document对象
Document document = sax.read("day21\\beans.xml");
//4.使用Document对象中的方法selectNodes|selectSingleNode解析xml文件
//获取beans下边所有的bean
List<Element> list01 = document.selectNodes("/beans/bean");
for (Element beanElement : list01) {
System.out.println(beanElement.getName()+"\t"+beanElement.attributeValue("id"));
}
System.out.println("--------------------");
//获取beans下边bean中的property
List<Element> list02 = document.selectNodes("/beans/bean/property");
for (Element propertyElement : list02) {
System.out.println(propertyElement.getName()+"\t"+propertyElement.attributeValue("value"));
}
System.out.println("--------------------");
//获取xml文档中所有的元素
List<Element> list03 = document.selectNodes("//*");
for (Element element : list03) {
System.out.println(element.getName());
}
System.out.println("--------------------");
//获取所有bean元素中的第一个bean元素
Element firstBeanElement = (Element)document.selectSingleNode("//bean[1]");
System.out.println(firstBeanElement.getName()+"\t"+firstBeanElement.attributeValue("id"));
//获取所有bean元素中的第最后一个bean元素
Element lastBeanElement = (Element)document.selectSingleNode("//bean[last()]");
System.out.println(lastBeanElement.getName()+"\t"+lastBeanElement.attributeValue("id"));
System.out.println("--------------------");
//获取所有bean元素中有className属性的
List<Element> list04 = document.selectNodes("//bean[@className]");
for (Element element : list04) {
System.out.println(element.getName()+"\t"+element.attributeValue("id"));
}
System.out.println("--------------------");
//获取所有property元素中有value属性的,并且value属性值是小猫的
Element catElement = (Element)document.selectSingleNode("//property[@value='小猫']");
System.out.println(catElement.getName()+"\t"+catElement.attributeValue("value"));
}
}