XML初步了解

1XML

 

1、1什么是XML

XML 指可扩展标记语言(EXtensible Markup Language),是一种标记语言,很类似 HTML XML语法上和HTML比较相似,但HTML中的元素是固定的,而XML的标签是可以用户自己定义的。注意:XML 不是对 HTML 的替代,XML 是对 HTML 的补充。因为很多时候我们还是需要沿用HTML 的元素标签。    

 

疑问:XML 是对 HTML 的补充。------主要补充了什么

 

1、2为什么要去学习XML

刚开始学习可以认为XML主要是用来配置文件的就行。

 

1、3  XML语法

XML语法包括:

 

(1、XML文档声明

<?xml version="1.0" encoding="UTF-8"?>

          1、文档必须为<?xml开头,以?>结尾;

          2、文档声明必须从文档的00列位置开始;

          3、文档声明只有三个属性:

             a)version:指定XML的版本。必须属性,开发中一般使用1.0版本,

                 因为高版本的1.1不向下兼容;

             b)encoding:指定当前文档的编码。可选属性,默认值是utf-8

 

(2XML元素;

1、元素是XML文档中最重要的组成部分;

2、普通元素的结构由开始标签、元素体、结束标签组成;

3、元素体:元素体可以是元素,也可以是文本;

4、空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合,比如:<c/>

5、元素命名:

         a)、区分大小写;

         b)、不能使用空格,不能使用冒号;

         c)、不建议以XMLxmlXml开头。

6、格式化良好的XML文档,必须只有一个根元素。

(3XML注释;

   XML的注释与HTML相同,即以“<!--”开始,以“-->”结束。注释内容会被解析器忽略!

(4XML属性;

   1、属性是元素的一部分,它必须出现在语速的开始标签中;

   2、属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引(单引双引都行,

     不过一般习惯使用双引);

   3、一个元素可以有0~N个属性,但是一个元素中不能出现同名属性;

   4、属性名不能使用空格、冒号等特殊字符,且必须以字母开头。

 

(5、转义字符;

 

XML中的转义字符与HTML一样。

因为很多符号已经被XML文档结构所使用,所以在元素体或者属性值中想使用这些符号就必须使用转移字符。

<

<

小于

>

>

大于

&

&

和号

'

单引号

"

引号

 

 

(6CDATA区;

 

语法:

<![CDATA[

....

]]>

 

当大量的转义字符出现在xml文档中时,会使xml文档的可读性大幅度降低。如果我们使用CDATA段就会好一些。

CDATA段中出现的“<”、“>”、“””、“’”、“&”,都无需使用转义字符。

CDATA段中不能包含“]]>,CDATA段的结束定界符

 

(7XML处理指令;

 

语法如下:

<?指令 属性=""     ?>

 

 

 

1、4 XML约束

常见的xml约束:DTDSchema

约束的目的:约束XML文档,规定XML文档中元素的名称,子元素的名称及顺序,元素的属性等。(开发中一般我们只需要能读懂XML约束文档就可以了,通常情况我们都是通过框架提供的约束)

141   DTD约束

开发中一般我们只需要能读懂XML约束文档就可以了,通常情况我们都是通过框架提供的DTD约束文档编写对应的XML文档。常见框架使用DTD约束有:struts2hibernate等。

 

1)、DTD语法(了解:能读懂即可)

     1、内部DTD,在XML文档内部嵌入DTD,支队当前XML有效。

 

     2、外部DTD--本地DTDDTD文档在本地系统上,公司内部去自己项目使用。

 

     3、外部DTD--公共DTDDTD文档在网络上,一般有框架提供。

 

2)、元素声明

定义元素语法:<!ELEMENT 元素名  元素描述>

元素名:自定义

元素描述包括:符号和数据类型

    常见符号:?  *   +  () |   ,

    常见类型:#PCDATA表示内容是文本,不能是子标签

 

3)、属性声明

 属性的语法:(attribute

     <!ATTLIST  元素名

         属性名   属性类型   约束

         属性名   属性类型   约束

         .....

     >

元素名:属性必须是给元素添加,所有必须先确定元素名

属性名:自定义

属性类型:IDCDATA、枚举......

    IDID类型的属性用来标识元素的唯一性

    CDATA:文本类型

    枚举:(e1|e2|...)多选一

约束:

    #REQUIRED:说明属性是必须的

    #IMPLIED:说明属性是可选的

 

142  Schema约束

1)、什么是SchemaW3School离线手册(2015.07.17)

     1Schema是新的XML文档约束;

     2Schema要比DTD强大的多,是DTD替代者;

     3Schema本身也是XML文档,但Schema文档的扩展名为xsd,而不是xml

     4Schema功能更强大,数据类型更完善

     5Schema支持名称空间

2)Schema重点要求

DTD一样,要求可以通过Schema约束文档编写xml文档。常见框架使用Schema的有:Spring

 

3)、案例实现步骤

 

 

4)、命名空间

 

 

声明命名空间:

    默认命名空间:<xxx   xmlns = “”>,使用<标签>

    显式命名空间:<xxx   xmlns :别名= “”>,使用<别名:标签>

 

5)、约束文档和XML关系

 

W3C提出Schema约束规范时,就提供“官方约束文档”。我们通过官方约束文档,必须“自定义schema约束文档”,开发中“自定义文档”由框架编写者提供。我们提供“自定义文档”限定,编写出自己的xml文档。

 

1、5  XML解析

151  XML解析的概述

    当将数据存储在XML后,我们希望通过程序获得XML的内容。通过Java基础所学的IO知识可以完成,但是操作起来相当繁琐。人们为不同问题提供不同的解析方式,并提交对应的解析器,方便开发人员操作XML

 

 

152  解析方式和解析器

1、开发中常见的解析方式有三种,如下:

   

    2、解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。

 

3、常见解析开发包

 

153  DOM解析原理及结构模型

    XML DOMHTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个DOM树,并获得一个Document对象,通过Document对象就可以对DOM进行操作。

    DOM中的核心概念就是节点,在XML文档中的元素、属性、文本等,在DOM中都是节点。

154  API使用

    如果需要使用dom4j,必须导入jar包。

    dom4j必须使用核心类SaxReader加载xml文档获得Document,通过Document对象获得文档的根元素,就可以操作了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值