XML语言基础

参考教程:W3school-XML教程

1.简介
    作为一种可扩展标记语言(eXtra Modern Link),用于结构化、传输和存储数据,能简化数据的存储和共享,简化平台的变更,独立于硬件和软件以及应用程序,可以创建新的internet语言(如XHTML、WSDL、WML、RSS、RDF和SML等)。其标签都是自定义的,XML是纯文本,自身不做任何事情,它是W3C的推荐标准。
    XML 被设计为传输和存储数据,其焦点是数据的内容,HTML 被设计用来显示数据,其焦点是数据的外观,HTML 旨在显示信息,而 XML 旨在传输信息。

2.XML树结构
先看一个XML文档
  1. #XML声明,定义版本(1.0)和使用编码(ISO-8859-1 = Latin-1/西欧字符集)
  2. <?xml version="1.0" encoding="ISO-8859-1"?>
  3. #文档根元素 
  4. <note>
  5. #接下来四行描述根的4个子元素
  6. <to>George</to>
  7. <from>John</from>
  8. <heading>Reminder</heading>
  9. <body>Don't forget the meeting!</body>
  10. #定义根元素的结尾
  11. </note>

各标签关系:
用上述XML语言表示一本书:
<bookstore>
<book category="COOKING">      #属性值加引号
 <title lang="en">Everyday Italian</title>
 <author>Giada De Laurentiis</author>
 <year>2005</year>
 <price>30.00</price>
</book>
<book category="CHILDREN">
 <title lang="en">Harry Potter</title>
 <author>JK. Rowling</author>
 <year>2005</year>
 <price>29.99</price>
</book>
</bookstore>

3.XML语法
      所有标签必须有关闭标签, XML的属性值必须加引号其标签区分字母的大小写,必须要有根元素,必须正确嵌套
<b><i>This text is bold and italic</i></b>
注意XML声明不属于XML本身的组成部分,不是XML元素,不需要关闭标签。

特殊字符的处理:
      如”<“,放在XML元素中会发生错误(只有字符”<“和”&“会发生错误),需要用实体引用代替”<“,共有5个预定义的实体引用。
#错误示例
<message>if salary < 1000 then</message>
#正确应用
<message>if salary &lt; 1000 then</message>
实体引用:
&lt; < 小于
&gt; > 大于
&amp; & 和号
&apos; ' 单引号
&quot; " 双引号

注释:
<!-- This is a comment --> 

空格会被保留,不会被删节,不像HTML中把来连续多个空格合并成一个;XML以LF存储换行, 在 Windows 应用程序中,换行通常以一对字符来存储,回车符 (CR) 和换行符 (LF), 在 Unix 应用程序中,新行以 LF 字符存储, Macintosh 应用程序使用 CR 来存储新行。

4.XML元素
       从开始标签直到结束标签的部分,包含起始结束标签, 元素可包含其他元素、文本或者两者的混合物,元素也可以拥有属性。
       参见2中的XML文档,其中<bookstore> 和 <book> 都拥有元素内容,因为它们包含了其他元素;<author> 只有文本内容,因为它仅包含文本,<book> 元素拥有属性 (category="CHILDREN")。

命名规则(可使用任何名称,没有保留的字词):
  1. 名称可以含字母、数字以及其他的字符
  2. 名称不能以数字或者标点符号开始
  3. 名称不能以字符 “xml”(或者 XML、Xml)开始
  4. 名称不能包含空格
  5. 最好使用<book_title>这种命名方式

元素可扩展,可以经常在不中断应用程序的情况进行扩展(不改变原有信息)。

5.XML属性(加单引号或双引号)
       XML 元素可以在开始标签中包含属性,类似 HTML, 属性 (Attribute) 提供关于元素的不属于数据组成部分的信息。
<img src="computer.gif">
<a href="demo.asp"> 
文件类型与数据无关,但是对需要处理这个元素的软件来说却很重要:
<file type="gif">computer.gif</file>
如果属性值本身包含双引号,那么有必要使用单引号包围它:
<gangster name='George "Shotgun" Ziegler'>
#或者用实体引用
<gangster name="George &quot;Shotgun&quot; Ziegler">
       在 HTML 中,属性用起来很便利,但是在 XML 中,应该尽量避免使用属性。如果信息感觉起来很像数据,请使用子元素。
为何不用属性?
  1. 属性无法包含多重的值(元素可以)
  2. 属性无法描述树结构(元素可以)
  3. 属性不易扩展(为未来的变化)
  4. 属性难以阅读和维护
仅仅使用属性来提供与数据无关的信息。
      元数据(有关数据的数据)应当存储为属性,而数据本身应当存储为元素。

6.XML验证DTD<Document Type Definition> 验证的 XML 是“合法”的 XML)
形式良好的XML:
XML 文档必须有根元素
XML 文档必须有关闭标签
XML 标签对大小写敏感
XML 元素必须被正确的嵌套
XML 属性必须加引号
遵守文档类型定义 (DTD) 的语法规则参见   DTD 教程
<?xml version="1.0" encoding="ISO-8859-1"?>
#DOCTYPE声明是对外部DTD文件的引用
<!DOCTYPE note SYSTEM "Note.dtd">
#<!DOCTYPE note [
#  <!ELEMENT note (to,from,heading,body)>
#  <!ELEMENT to (#PCDATA)>
#  <!ELEMENT from (#PCDATA)>
#  <!ELEMENT heading (#PCDATA)>
#  <!ELEMENT body (#PCDATA)>
#]>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>  
 W3C支持一种基于XML的DTD的替代者 XML Schema 教程

7.XML验证器
     XML 文档中的错误会终止你的 XML 程序,为此W3C创建了一个 XML验证器

8.格式化XML
     通过使用 CSS,可为 XML 文档添加显示信息使用 CSS 来格式化 XML 文档,美化XML的目录。
     第二行,<?xml-stylesheet type="text/css" href="cd_catalog.css"?>,把这个 XML 文件链接到 CSS 文件
<?xml version="1.0" encoding="ISO-8859-1"?>
<?xml-stylesheet type="text/css" href="cd_catalog.css"?>
<CATALOG>
  <CD>
  <TITLE>Empire Burlesque</TITLE>
  <ARTIST>Bob Dylan</ARTIST>
  <COUNTRY>USA</COUNTRY>
  <COMPANY>Columbia</COMPANY>
  <PRICE>10.90</PRICE>
  <YEAR>1985</YEAR>
  </CD>
...
推荐使用 XSLT,用法和CSS类似,XLT(eXtensible Stylesheet Language)

供XML解析器忽略XML文档的特定部分的正确语法是:
<![CDATA[ Text to be ignored ]]>
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值