学习XML


1.xml概述

可扩展性标记语言,标签都是自定义的,例如<user><student>

1.1.引入

  • Xml数据格式最主要的功能就是 数据传输

那么Xml数据格式主要的用途又有哪些?

  • 程序之间的数据传输通讯
  • 配置文件config.xml
  • 存储数据,充当小型数据库
特点:规范数据格式,使数据具有结构性,易读易处理

1.2.什么是xml

  • Xml指的是,可扩展性标记语言
  • Xml被发明的目的是传输和存储数据,而不是展示数据
  • Xml的标签必须自定义(html不能自定义),但是在写标签名的时候一定要有含义
  • Xml是w3c推举的数据传输格式

①如何自己写一段xml

<root><!--根结点-->
    <user>helloXMl</user>
    <msg>helloXML</msg>
</root>

②Xml和html有哪些不一样?

  • Html标签不能自定义,xml标签只能自定义
  • Html语法要求不严格(比如说不写结束标签也是可以的),xml语法要求极其严格(必须是成对标签)
  • Xml用来传输和存储数据,html用来展示数据

2.xml的基本语法

  • Xml必须有根结点,有且只有一个,例如<root> </root>(也可以不叫root)
  • 根结点就是其他所有节点的父级节点
  • Xml头声明必须在第一行:不强制要求,可有可无,但是建议写上
  • 所有xml元素都必须是成对标签
  • 标签名大小写敏感
  • 标签不可以交叉
  • 特殊字符使用实体转移,比如(要想使用“<”,可写成“&lt”)
  • 在xml中需要转义的字符有:<(&lt) >(&gt) &(&amp) ‘(&apos) “(&quot)
<?xml version="1.0" encoding="utf-8" ?><!--这就是xml的头声明-->
<root><!--此文档中的根结点就是root-->
    <suibian>....</suibian>
    <xie>....</xie>
</root>
<?xml version="1.0" encoding="utf-8" standalone='yes' ?>
<users>
    <user id='1'>
        <name>lyh</name>
        <age>21</age>
        <gender>female</gender>
    </user>

    <user id='2'>
        <name>mlb</name>
        <age>21</age>
        <gender>male</gender>
    </user>

</users>

3.组成部分

3.1.文档声明:

(1)格式<?xml version="1.0" 属性列表 ?>
(2)属性列表:

  • version:版本号,必须的属性
  • encoding:编码方式,告知解析引擎当前文档使用的字符集,默认值:ISO-8859-1
  • standalone:是否独立
    取值
    yes:不依赖其他文件
    no:依赖其他文件

3.2.指令:结合css的

<?xml-stylesheet type="text/css" href="learnxml01.css"?>
<?xml version="1.0" encoding="utf-8" standalone='yes' ?>
<?xml-stylesheet type="text/css" href="learnxml01.css"?>
<users>
    <user id='1'>
        <name>lyh</name>
        <age>21</age>
        <gender>female</gender>
    </user>

    <user id='2'>
        <name>mlb</name>
        <age>21</age>
        <gender>male</gender>
        <code>
            if(a &lt; b &amp; a &gt; c){}
        </code>
    </user>

</users>
name{
    color:red
}

在这里插入图片描述

3.3.标签:标签名称自定义的

规则:

  • 名称可以包含字母、数字以及其他的字符
  • 名称不能以数字或者标点符号开始
  • 名称不能以字母xml(或者XML、Xml等等)开始
  • 名称不能包含空格

3.4.属性

  • id属性值唯一
属性就是表示标签自身的一些额外信息,html中属性是不可或缺的,因为html不可以自定义标签

①属性规则:

  • 一个标签可以有多个属性,属性的值必须使用引号括起来
  • 命名规则:数字字母,下划线,数字不能开头
Xml中属性就是鸡肋(食之无味,弃之可惜) 在解析xml数据时,属性会带来额外的解析代码(多了一步,比较麻烦)

3.5.CDATA:在该区域中的数据会被原样展示

格式:<![CDATA[数据]]>

<?xml version="1.0" encoding="utf-8" ?>
<root>
    <man>
        <name>数学题</name>
        <!--CDATA内容不解析-->
        <!--<![CDATA[.....不解析的内容]]>-->
        <msg><![CDATA[...3>7..不解析的内容..4<5...好多好多......]]></msg>
    </man>
</root>

注意:特殊字符较少时,使用实体替换,较多时使用CDATA,CDATA必须大写

4.约束:规定xml文档的书写规则

分类:

  • DTD:一种简单的约束技术
  • Schema:一种复杂的约束技术

4.1.DTD约束

引入dtd文档到xml文件中
(1)内部dtd:将约束规则定义在xml文档中

<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE students[
        <!ELEMENT students (student*) >
        <!ELEMENT student (name,age,sex)>
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        <!ELEMENT sex (#PCDATA)>
        <!ATTLIST student number ID #REQUIRED>
        ]>
<students>
    <student number="s001">
        <name>lyh</name>
        <age>21</age>
        <sex>female</sex>
    </student>

    <student number="s002">
        <name>mlb</name>
        <age>21</age>
        <sex>male</sex>
    </student>

</students>

(2)外部dtd:将约束的规则定义在外部的dtd文件中

  • 本地文件<!DOCTYPE 根标签名 SYSTEM "DTD文件位置">
  • 网络文件<!DOCTYPE 根标签名 PUBLIC "DTD文件名字" "DTD文件的位置,也就是URL">

student.xml文件

<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE students SYSTEM "student.dtd">

<students>
    <student number="s001">
        <name>lyh</name>
        <age>21</age>
        <sex>female</sex>
    </student>

    <student number="s002">
        <name>mlb</name>
        <age>21</age>
        <sex>male</sex>
    </student>

</students>
  • student.dtd文件
<!--定义了根标签,名为students,它下面有个子标签,名为student,
student可以出现0~n次(+则表示至少一次),-->
        <!ELEMENT students (student*) >
        <!--student标签下包含name,age,sex标签,这些标签只能出现一次-->
        <!ELEMENT student (name,age,sex)>
        <!--#PCDATA表示该标签为字符串-->
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        <!ELEMENT sex (#PCDATA)>
        <!--ATTLIST student number ID表示student标签有个ID属性(表示不能重复出现),
        该属性num称为number,#REQUIRED表示该标签必须,而且student标签有个-->
        <!ATTLIST student number ID #REQUIRED>

4.2.schema约束

DTD能够对标签进行约束,但是不能够对标签里的内容进行约束,而schema则可以对标签内内容进行约束

  • student.xml文件
<?xml version="1.0" encoding="UTF-8" ?>
<!--
    1.填写xml文档的根元素
    2.引入xsi前缀,xmlns:xsi=xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    3.引入xsd文件命名空间,xsi:xsi:schemaLocation="http://www.XXX.cn/xml  student.xsd"
    4.为每一个xsd约束声明一个前缀,作为标识,xmlns="http://www.XXX.cn/xml
-->
<students   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
            xsi:schemaLocation="http://www.XXX.cn/xml  student.xsd"
            xmlns="http://www.XXX.cn/xml">
    <student number="id_0001">
        <name>lyh</name>
        <age>21</age>
        <sex>female</sex>
    </student>

    <student number="id_0002">
        <name>mlb</name>
        <age>21</age>
        <sex>male</sex>
    </student>


</students>
  • student.xsd文件
<?xml version="1.0"?>
<xsd:schema
        xmlns:xsd="http://www.w3.org/2001/XMLSchema"
        targetNamespace="http://www.XXX.cn/xml"
        xmlns="http://www.XXX.cn/xml"
        elementFormDefault="qualified">
    <!--
            1、上面的xmlns:xsd="http://www.w3.org/2001/XMLSchema"是规定写法,
            2、targetNamespace="http://www.XXX.cn/xml"表示引入文档的别名,引入文档
                的别名要和这个一样
            3、 xmlns="http://www.XXX.cn/xml"这个是给别名取个简单的前缀,这里没有前缀
    -->

    <!--定义一个元素,元素的标签名为students,该标签类型为studentsType,是一个自定义类型-->
    <xsd:element name="students" type="studentsType"/>
    <!-- 对上面自定义的类型studentsType进行解释,complexType表示它是一个复合类,   -->
    <xsd:complexType name="studentsType">
        <!-- 表示是有顺序-->
        <xsd:sequence>
            <!-- 表示studentsType类型的标签里面包含了一个元素,约束名为student,
            而且类型为studentType,最小出现0次,最多出现个数不限-->
            <xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
        </xsd:sequence>
    </xsd:complexType>
    <!-- 对上面自定义的类型studentType进行解释,complexType表示它是一个复合类,   -->
    <xsd:complexType name="studentType">
        <xsd:sequence>
            <!-- 表示类型studentType标签内容包含以下标签,标签的类型分别作了规定都是自定义,
            而且这些标签都是有顺序的-->
            <xsd:element name="name" type="xsd:string"/>
            <xsd:element name="age" type="ageType" />
            <xsd:element name="sex" type="sexType" />
        </xsd:sequence>
        <!--表示studentType标签包含一个属性,属性名字为number,类型为numberType自定义,
        use="required"表示该属性时必须写的-->
        <xsd:attribute name="number" type="numberType" use="required"/>
    </xsd:complexType>
    <!-- 下面是对上面出现过的标签的自定义类型进行逐个解释,simpleType表示是个简单标签-->
    <xsd:simpleType name="sexType">
        <!-- 表示sexType标签的包含的内容类型为string(字符串),而且是枚举,取值只能是male、female-->
        <xsd:restriction base="xsd:string">
            <xsd:enumeration value="male"/>
            <xsd:enumeration value="female"/>
        </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType name="ageType">
        <!--表示ageType标签的内容的类型为integer(整数型),取值范围为0~256-->
        <xsd:restriction base="xsd:integer">
            <xsd:minInclusive value="0"/>
            <xsd:maxInclusive value="256"/>
        </xsd:restriction>
    </xsd:simpleType>
    <xsd:simpleType name="numberType">
        <!--对标签numberType的内容类型规定为string,而且内容必须以id_开头,
        后面跟4位数字,比如id_0001-->
        <xsd:restriction base="xsd:string">
            <xsd:pattern value="id_\d{4}"/>
        </xsd:restriction>
    </xsd:simpleType>
</xsd:schema>

5.解析:操作xml文档,将文档中的数据读取到内存中

5.1.操作xml文档

  • 解析(读取):将文档中的数据读取到内存中
  • 写入:将内存中的数据保存到xml文档中,持久化的存储

5.2.解析xml的方式

(1)DOM:将标记语言文档一次性加载进内存,在内存中形成一棵dom树
在这里插入图片描述

优点:操作方便,可以对文档进行CRUD的所有操作
缺点:占内存
(2)SAX:逐行读取,基于事件驱动的
优点:不占内存
缺点:只能读取,不能增删改

综上所述,一般在服务端采用DOM的思想解析xml,在移动端使用SAX的思想解析XML

5.3.xml常见的解析器

(1)JAXP:sun公司提供的解析器,支持dom和sax两种思想
(2)DOM4J:一款非常优秀的解析器
(3)Jsoup:jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
(4)PULL:安卓操作系统内置的解析器,是sax方式的

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值