XML

            xml

 xml可扩展标记语言英文名称:extensible markup language;XML 定义:用于标记电子文件使其具有结构性的
标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。


tip:xml语法——文档声明。
在编写xml文档时,需要先使用文档声明声明xml文档的类型。

 

最简单的语法:
<?xml version="1.0" ?>

用encoding属性来说明文的字符码表:
<?xml version="1.0" encoding="gb2321" ?>

用standalone属性说明文档是否独立:
<xml version="1.0" encoding="gb2321" standalone="yes" ?>

 

tip:元素(1)(element)
xml元素指定xml文件中出现的标签,一个标签分为开始标签和结束标签,
一个标签有如下几种属性形式
例如:
 包含标签体:<a>www.itcast.cn</a>
 不包含标签体的<a></a>,可以简写为<a/>

一个标签中也可以嵌套若干个子标签。但是所有标签必须合理的嵌套,决不能润许交叉嵌套,
例如:
 <a>welcme to <b> www.it315.org</a></b>

格式良好的xml文档必须有一个且仅有一个跟标签,其他的标签都是这个跟标签的子孙标签。

 


itp:元素(2)

对与xml标签中出现的所有空格和换行,xml解析程序都会当做标签内容进行处理。
例如:下面两个内容的意义是一样的。

1.
<网址>www.itcast.cn</网址>
2.
<网址>
 www.itcast.cn
</网址>

用于xml中,空格和换行都为了原始内容被处理,所以编写xml文件shi,使用换行
和缩进的方式来让源文件的内容清晰可读“良好”书写习惯可能要被迫改变。

 

itp:元素(3)——命名规范
一个xml原始可以包含字母,数字以及其他一些可见的字符,但必须遵守iam的规范:
1.区分大小写。例如<P>和<p>是两个不同的标记。
2.不能以数字或者"_"(下划线)开头。
3.不能以xml(XML.或者Xml等)开头
4.不能包含空格。
5.名称中间不能包含冒汗(:);


tip:属性
一个标签可以有多个属性,每一个属性都有他自己的名称和取值
例如:
 <input name = "text">

属性值一定要用引号(“)或者单引号(‘)引起来。

定义属性必须要遵守与标签相同的命名规范

多学一招:在xml中,标签属性锁带便的信息,也可以被改成资源税的形式来描述,
例如:
<input>
 <name>text</name>
</input>

 

tip:注释
xml中注释采用<!--注释-->的格式
注意:
xml声明之前不能有注释
注释不能嵌套,
例如:
<!--大段注释
 <!--局部注释-->
 ...
-->

 

tip:CDATA区
在编写xml文件时,有些内容可能不想让解析印象解析执行,而是当做原始内容来处理。
遇到这种情况,可以吧这些内容放在CDATA区中,对于caata区域内的内容,xml解析程序不会
处理,而是直接原封不动的输出。语法<![CDATA[内容]]>

 

tip:转义字符
对于一些单个的字符,弱项显示其原始样式,也可以使用转义字的形式处理
特殊字符           代替符号
 &    &amp;
 <    &lt;
 >    &gt;
 "    &quot;
 '    apos;


tip:处理指令
助理指令。成为pl(processing instruction)处理指定来指挥解析引擎如何解析xml文档内容。

例如,在xml文档中可以使用xml-stylesheet指令,通知xml解析引擎,应用css文件显示xml文档内容。
<?xml=stylesheet type="text/css" href="1.css" ?>

处理指令必须以<?开头   以?>结尾,xml声明语句就是最长久的一种处理指令。。

 


Tip:XML约束概述
什么是XML约束
在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。
为什么需要XML约束

常用的约束技术
XML DTD
XML Schema

 


Tip:DTD约束快束入门
DTD(Document Type Definition),全称为文档类型定义。
事例:
文件清单:book.xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE 书架 SYSTEM "book.dtd">
<书架>
 <书>
  <书名>Java就业培训教程</书名>
  <作者>张孝祥</作者>
  <售价>39.00元</售价>
 </书>
 <书>
  <书名>JavaScript网页开发</书名>
  <作者>张孝祥</作者>
  <售价>28.00元</售价>
 </书>
</书架>

文件清单:book.dtd
 
<!ELEMENT 书架 (书+)>
 <!ELEMENT 书 (书名,作者,售价)>
 <!ELEMENT 书名 (#PCDATA)>
 <!ELEMENT 作者 (#PCDATA)>
 <!ELEMENT 售价 (#PCDATA)>
注意:DTD文件应使用UTF-8或Unicode

 

Tip:编程校验XML文档正确性

IE5以上浏览器内置了XML解析工具:Microsort.XMLDOM,开发人员可以编写javascript代码,利用这
个解析工具装载xml文件,并对xml文件进行dtd验证。
创建xml文档解析器对象
var xmldoc = new ActiveXObject("Microsoft.XMLDOM");

开启xml校验
xmldoc.validateOnParse = "true";

装载xml文档
xmldoc.load("book.xml");

获取错误信息
xmldoc.parseError.reason; 
xmldoc.parseError.line

 


Tip:编写DTD约束的第二种种方式
DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。

事例:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<!DOCTYPE 书架 [
 <!ELEMENT 书架 (书+)>
 <!ELEMENT 书 (书名,作者,售价)>
 <!ELEMENT 书名 (#PCDATA)>
 <!ELEMENT 作者 (#PCDATA)>
 <!ELEMENT 售价 (#PCDATA)>
]>
<书架>
 <书>
  <书名>Java就业培训教程</书名>
  <作者>张孝祥</作者>
  <售价>39.00元</售价>
 </书>
 ...
</书架>


Tip:引用DTD约束

XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:

当引用的文件在本地时,采用如下方式:
  <!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
 例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>。在xml文件中手写一下。

当引用的文件是一个公共的文件时,采用如下方式: 
  <!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">

  例如:<!DOCTYPE web-app PUBLIC
  "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"
  "http://java.sun.com/dtd/web-app_2_3.dtd">

 


Tip: DTD 的语法细节:元素定义1

在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:
  <!ELEMENT 元素名称 元素类型>
元素类型可以是元素内容、或类型
如为元素内容:则需要使用()括起来,如
 <!ELEMENT 书  (书名,作者,售价)>
 <!ELEMENT 书名 (#PCDATA)>
如为元素类型,则直接书写,DTD规范定义了如下几种类型:
EMPTY:用于定义空元素,例如<br/> <hr/>
ANY:表示元素内容为任意类型。

 

Tip: DTD 的语法细节:元素定义2

元素内容中可以使用如下方式,描述内容的组成关系
用逗号分隔,表示内容的出现顺序必须与声明时一致。<!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>
 用|分隔,表示任选其一,即多个只能出现一个
 <!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>
在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
  +: 一次或多次 (书+)    regex
   ?: 0次或一次 (书?)
   *: 0次或多次  (书*)
也可使用圆括号( )批量设置,例
 <!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

 


Tip:属性定义   attribute

xml文档中的标签属性需通过ATTLIST为其设置属性
语法格式:
 <!ATTLIST 元素名
  属性名1 属性值类型 设置说明
  属性名2 属性值类型 设置说明
  ……
 >
属性声明举例:
<!ATTLIST 商品
 类别 CDATA #REQUIRED
 颜色 CDATA #IMPLIED
>
对应XML文件:
 <商品 类别="服装" 颜色="黄色">…</商品>
 <商品 类别="服装">…</商品>

 


Tip:属性定义

设置说明:
 #REQUIRED:必须设置该属性
 #IMPLIED:可以设置也可以不设置
 #FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值
直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默
认值。但需要为该属性提供这个值


举例:
      <!ATTLIST 页面作者
      姓名 CDATA #IMPLIED
      年龄 CDATA #IMPLIED
      联系信息 CDATA #REQUIRED
      网站职务 CDATA #FIXED "页面作者"
      个人爱好 CDATA "上网"
       >

 


Tip:常用属性值类型
 CDATA:表示属性值为普通文本字符串。
 ENUMERATED
 ID  identity
 ENTITY(实体)

 


Tip:属性值类型ENUMERATED
属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的
某个值(枚举)

示例:
<?xml version = "1.0" encoding="GB2312" standalone="yes"?>
<!DOCTYPE 购物篮 [
 <!ELEMENT 肉 EMPTY>
 <!ATTLIST 肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉">
]>
<购物篮>
     <肉 品种 ="鱼肉"/>
     <肉 品种 ="牛肉 "/>
     <肉/>
</购物篮>

 


Tip:属性值类型 ID

表示属性的设置值为一个唯一值。
ID 属性的值只能由字母,下划线开始,不能出现空白字符

示例:
?xml version = "1.0" encoding="GB2312" ?>

<!DOCTYPE 联系人列表[
 <!ELEMENT 联系人列表 ANY>
 <!ELEMENT 联系人 (姓名,EMAIL)>
 <!ELEMENT 姓名 (#PCDATA)>
 <!ELEMENT EMAIL (#PCDATA)>
 <!ATTLIST 联系人 编号 ID #REQUIRED>
]>

<联系人列表>
 <联系人 编号="a1">
  <姓名>张三</姓名>
  <EMAIL>zhang@it315.org</EMAIL>
     </联系人>
 <联系人 编号="b1">
  <姓名>李四</姓名>
  <EMAIL>li@it315.org</EMAIL>
 </联系人>
</联系人列表>

 


Tip:实体定义

实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。
在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。
实体可分为两种类型:引用实体和参数实体。

 


Tip:实体定义引用实体

引用实体主要在 XML 文档中被应用
语法格式:
<!ENTITY 实体名称 “实体内容” >:直接转变成实体内容
引用方式:
&实体名称;
举例:
 <!ENTITY copyright “I am a programmer">
  ……
  &copyright;

 

 

Tip:实体定义参数实体 


参数实体被 DTD 文件自身使用
语法格式:
   <!ENTITY % 实体名称 "实体内容" >
引用方式:
%实体名称;
举例1:
  <!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">
 
    <!ELEMENT 个人信息 (% TAG_NAMES; | 生日)>
  <!ELEMENT 客户信息 (% TAG_NAMES; | 公司名)>
举例2:
<!ENTITY % common.attributes
  " id ID #IMPLIED
 account CDATA #REQUIRED "
>
...
<!ATTLIST purchaseOrder  %common.attributes;>
<!ATTLIST item %common.attributes;>


面试可能会的问到。

Dom 和sax解析方法的区别:
1.dom解析的有点事对温度crud比较方便,缺点是占用内存比较大
2.sax解析的有点事占用内存少,解析速度快,缺点是适合做文档读取。不适合做文档crud

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值