文章目录
1.xml概述
可扩展性标记语言,标签都是自定义的,例如<user><student>
1.1.引入
- Xml数据格式最主要的功能就是 数据传输
那么Xml数据格式主要的用途又有哪些?
- 程序之间的数据传输通讯
- 配置文件config.xml
- 存储数据,充当小型数据库
1.2.什么是xml
- Xml指的是,可扩展性标记语言
- Xml被发明的目的是传输和存储数据,而不是展示数据
- Xml的标签必须自定义(html不能自定义),但是在写标签名的时候一定要有含义
- Xml是w3c推举的数据传输格式
①如何自己写一段xml
<root><!--根结点-->
<user>helloXMl</user>
<msg>helloXML</msg>
</root>
②Xml和html有哪些不一样?
- Html标签不能自定义,xml标签只能自定义
- Html语法要求不严格(比如说不写结束标签也是可以的),xml语法要求极其严格(必须是成对标签)
- Xml用来传输和存储数据,html用来展示数据
2.xml的基本语法
- Xml必须有根结点,有且只有一个,例如
<root> </root>
(也可以不叫root) - 根结点就是其他所有节点的父级节点
- Xml头声明必须在第一行:不强制要求,可有可无,但是建议写上
- 所有xml元素都必须是成对标签
- 标签名大小写敏感
- 标签不可以交叉
- 特殊字符使用实体转移,比如(要想使用“<”,可写成“<”)
- 在xml中需要转义的字符有:<(<) >(>) &(&) ‘(&apos) “(")
<?xml version="1.0" encoding="utf-8" ?><!--这就是xml的头声明-->
<root><!--此文档中的根结点就是root-->
<suibian>....</suibian>
<xie>....</xie>
</root>
<?xml version="1.0" encoding="utf-8" standalone='yes' ?>
<users>
<user id='1'>
<name>lyh</name>
<age>21</age>
<gender>female</gender>
</user>
<user id='2'>
<name>mlb</name>
<age>21</age>
<gender>male</gender>
</user>
</users>
3.组成部分
3.1.文档声明:
(1)格式<?xml version="1.0" 属性列表 ?>
(2)属性列表:
- version:版本号,必须的属性
- encoding:编码方式,告知解析引擎当前文档使用的字符集,默认值:ISO-8859-1
- standalone:是否独立
取值
yes:不依赖其他文件
no:依赖其他文件
3.2.指令:结合css的
<?xml-stylesheet type="text/css" href="learnxml01.css"?><?xml version="1.0" encoding="utf-8" standalone='yes' ?>
<?xml-stylesheet type="text/css" href="learnxml01.css"?>
<users>
<user id='1'>
<name>lyh</name>
<age>21</age>
<gender>female</gender>
</user>
<user id='2'>
<name>mlb</name>
<age>21</age>
<gender>male</gender>
<code>
if(a < b & a > c){}
</code>
</user>
</users>
name{
color:red
}
3.3.标签:标签名称自定义的
规则:
- 名称可以包含字母、数字以及其他的字符
- 名称不能以数字或者标点符号开始
- 名称不能以字母xml(或者XML、Xml等等)开始
- 名称不能包含空格
3.4.属性
- id属性值唯一
①属性规则:
- 一个标签可以有多个属性,属性的值必须使用引号括起来
- 命名规则:数字字母,下划线,数字不能开头
3.5.CDATA:在该区域中的数据会被原样展示
格式:<![CDATA[数据]]>
<?xml version="1.0" encoding="utf-8" ?>
<root>
<man>
<name>数学题</name>
<!--CDATA内容不解析-->
<!--<![CDATA[.....不解析的内容]]>-->
<msg><![CDATA[...3>7..不解析的内容..4<5...好多好多......]]></msg>
</man>
</root>
注意:特殊字符较少时,使用实体替换,较多时使用CDATA,CDATA必须大写
4.约束:规定xml文档的书写规则
分类:
- DTD:一种简单的约束技术
- Schema:一种复杂的约束技术
4.1.DTD约束
引入dtd文档到xml文件中
(1)内部dtd:将约束规则定义在xml文档中
<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE students[
<!ELEMENT students (student*) >
<!ELEMENT student (name,age,sex)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!ATTLIST student number ID #REQUIRED>
]>
<students>
<student number="s001">
<name>lyh</name>
<age>21</age>
<sex>female</sex>
</student>
<student number="s002">
<name>mlb</name>
<age>21</age>
<sex>male</sex>
</student>
</students>
(2)外部dtd:将约束的规则定义在外部的dtd文件中
- 本地文件
<!DOCTYPE 根标签名 SYSTEM "DTD文件位置">
- 网络文件
<!DOCTYPE 根标签名 PUBLIC "DTD文件名字" "DTD文件的位置,也就是URL">
student.xml文件
<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE students SYSTEM "student.dtd">
<students>
<student number="s001">
<name>lyh</name>
<age>21</age>
<sex>female</sex>
</student>
<student number="s002">
<name>mlb</name>
<age>21</age>
<sex>male</sex>
</student>
</students>
- student.dtd文件
<!--定义了根标签,名为students,它下面有个子标签,名为student,
student可以出现0~n次(+则表示至少一次),-->
<!ELEMENT students (student*) >
<!--student标签下包含name,age,sex标签,这些标签只能出现一次-->
<!ELEMENT student (name,age,sex)>
<!--#PCDATA表示该标签为字符串-->
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!--ATTLIST student number ID表示student标签有个ID属性(表示不能重复出现),
该属性num称为number,#REQUIRED表示该标签必须,而且student标签有个-->
<!ATTLIST student number ID #REQUIRED>
4.2.schema约束
DTD能够对标签进行约束,但是不能够对标签里的内容进行约束,而schema则可以对标签内内容进行约束
- student.xml文件
<?xml version="1.0" encoding="UTF-8" ?>
<!--
1.填写xml文档的根元素
2.引入xsi前缀,xmlns:xsi=xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
3.引入xsd文件命名空间,xsi:xsi:schemaLocation="http://www.XXX.cn/xml student.xsd"
4.为每一个xsd约束声明一个前缀,作为标识,xmlns="http://www.XXX.cn/xml
-->
<students xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.XXX.cn/xml student.xsd"
xmlns="http://www.XXX.cn/xml">
<student number="id_0001">
<name>lyh</name>
<age>21</age>
<sex>female</sex>
</student>
<student number="id_0002">
<name>mlb</name>
<age>21</age>
<sex>male</sex>
</student>
</students>
- student.xsd文件
<?xml version="1.0"?>
<xsd:schema
xmlns:xsd="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www.XXX.cn/xml"
xmlns="http://www.XXX.cn/xml"
elementFormDefault="qualified">
<!--
1、上面的xmlns:xsd="http://www.w3.org/2001/XMLSchema"是规定写法,
2、targetNamespace="http://www.XXX.cn/xml"表示引入文档的别名,引入文档
的别名要和这个一样
3、 xmlns="http://www.XXX.cn/xml"这个是给别名取个简单的前缀,这里没有前缀
-->
<!--定义一个元素,元素的标签名为students,该标签类型为studentsType,是一个自定义类型-->
<xsd:element name="students" type="studentsType"/>
<!-- 对上面自定义的类型studentsType进行解释,complexType表示它是一个复合类, -->
<xsd:complexType name="studentsType">
<!-- 表示是有顺序-->
<xsd:sequence>
<!-- 表示studentsType类型的标签里面包含了一个元素,约束名为student,
而且类型为studentType,最小出现0次,最多出现个数不限-->
<xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
</xsd:sequence>
</xsd:complexType>
<!-- 对上面自定义的类型studentType进行解释,complexType表示它是一个复合类, -->
<xsd:complexType name="studentType">
<xsd:sequence>
<!-- 表示类型studentType标签内容包含以下标签,标签的类型分别作了规定都是自定义,
而且这些标签都是有顺序的-->
<xsd:element name="name" type="xsd:string"/>
<xsd:element name="age" type="ageType" />
<xsd:element name="sex" type="sexType" />
</xsd:sequence>
<!--表示studentType标签包含一个属性,属性名字为number,类型为numberType自定义,
use="required"表示该属性时必须写的-->
<xsd:attribute name="number" type="numberType" use="required"/>
</xsd:complexType>
<!-- 下面是对上面出现过的标签的自定义类型进行逐个解释,simpleType表示是个简单标签-->
<xsd:simpleType name="sexType">
<!-- 表示sexType标签的包含的内容类型为string(字符串),而且是枚举,取值只能是male、female-->
<xsd:restriction base="xsd:string">
<xsd:enumeration value="male"/>
<xsd:enumeration value="female"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="ageType">
<!--表示ageType标签的内容的类型为integer(整数型),取值范围为0~256-->
<xsd:restriction base="xsd:integer">
<xsd:minInclusive value="0"/>
<xsd:maxInclusive value="256"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="numberType">
<!--对标签numberType的内容类型规定为string,而且内容必须以id_开头,
后面跟4位数字,比如id_0001-->
<xsd:restriction base="xsd:string">
<xsd:pattern value="id_\d{4}"/>
</xsd:restriction>
</xsd:simpleType>
</xsd:schema>
5.解析:操作xml文档,将文档中的数据读取到内存中
5.1.操作xml文档
- 解析(读取):将文档中的数据读取到内存中
- 写入:将内存中的数据保存到xml文档中,持久化的存储
5.2.解析xml的方式
(1)DOM:将标记语言文档一次性加载进内存,在内存中形成一棵dom树
优点:操作方便,可以对文档进行CRUD的所有操作
缺点:占内存
(2)SAX:逐行读取,基于事件驱动的
优点:不占内存
缺点:只能读取,不能增删改
综上所述,一般在服务端采用DOM的思想解析xml,在移动端使用SAX的思想解析XML
5.3.xml常见的解析器
(1)JAXP:sun公司提供的解析器,支持dom和sax两种思想
(2)DOM4J:一款非常优秀的解析器
(3)Jsoup:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
(4)PULL:安卓操作系统内置的解析器,是sax方式的