DTD——XML介绍和基本语法

目录

一.XML

1.什么是XML

2.为什么学习XML

3.XML的作用

4.标准的XM格式

4.1.XML语法-文档声明

4.2.XML语法-元素

注意事项和细节问题:

4.3.XML语法-属性

 4.4.XML—定义有效的属性

​编辑

4.5.XML语法-CDATA节

4.7.XML语法-注释


一.XML

1.什么是XML

  1. XML 指可扩展标记语言(EXtensible Markup Language)
  2. XML 是一种标记语言,类似 HTML
  3. XML 的设计宗旨是传输数据,而非显示数据
  4. XML 标签没有被预定义。您需要自行定义标签。
  5. XML 被设计为具有自我描述性。
  6. XML 是 W3C 的推荐标准

 2.为什么学习XML

在XML语言中,它允许用户自定义标签。一个标签用于描述一段数据;一个标签可以分为开始标签和结束标签,在开始标签和结束标签之间,又可以使用其他标签描述其他数据,以此来实现数据关系的描述。

 

3.XML的作用

数据库交互

做配置

4.标准的XM格式

1.文档声明 
2.元素 
3.属性 
4.定义有效的属性
5.CDATA区、特殊字符 

6.注释

4.1.XML语法-文档声明

1.XML声明放在XML文档的第一行 
2.<?xml version="1.0" encoding="utf-8" standalone="yes" ?>

XML声明由以下几个部分组成:

version –文档符合XML1.0规范,我们学习1.0 
encoding –文档字符编码,比如”GB2312”或者”UTF-8” 
standalone –文档定义是否独立使用 
standalone=”no”为默认值。yes代表是独立使用,而no代表不是独立使用

4.2.XML语法-元素

(1)每个XML文档必须有且只有一个根元素

  • 根元素是一个完全包括文档中其他所有元素的元素
  • 根元素的起始标记要放在所有其他元素的起始标记之前
  • 跟元素的结束标记要放在所有其他元素的结束标记之后     
    (2)XML元素指的是XML文件中出现的标签,一个标签分为开始标签和结束标签,一个标签有如下几种书写方式,
  • 包含标签体:
    <a>www.sohu.com</a>
  • 不含标签体的:
    <a></a>,简写为:<a/>

    (3)一个标签中也可以嵌套若干子标签。但所有标签必须合理地嵌套,绝对不允许交叉嵌套,例如

  • 注意事项和细节问题:

  • (3)一个标签中也可以嵌套若干子标签。但所有标签必须合理地嵌套,绝对不允许交叉嵌套,例如
    <a>welcome to <b> www.sohu.com </a></b>
  • 这种情况肯定是要报错的。

    (2)由于在XML中,空格和换行都作为原始内容被处理,所以,在编写XML文件时,要特别注意。

    (3)命名规范:一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守以下规范:

  • 区分大小写,例如,元素P和元素p是两个不同的元素
  • 不能以数字或下划线”_”开头
  • 元素内不能包含空格
  • 名称中间不能包含冒号(:)
  • 可以使用中文,但一般不这么用

    4.3.XML语法-属性

    <student id="100">
        <name>Tom</name>
    </student>

    (1)属性值用双引号(”)或单引号(’)分隔,如果属性值中有单引号,则用双引号分隔;如果有双引号,则用单引号分隔。那么如果属性值中既有单引号还有双引号怎么办?这种要使用实体(转义字符,类似于html中的空格符),XML有5个预定义的实体字符,如下:

    (2)一个元素可以有多个属性,它的基本格式为:

    <元素名 属性名1="属性值1" 属性名2="属性值2">
    <person pid="p1" sex="男" qq="aaa" parent="p2">

     


  • (3)特定的属性名称在同一个元素标记中只能出现一次 
  • (4)属性值不能包括<,>,&,如果一定要包含,也要使用实体

     4.4.XML—定义有效的属性

    <!DOCTYPE persons[
    	<!ELEMENT persons (person+)>
    	<!ELEMENT person (name,age,contact,br*)>
    	<!ELEMENT name (#PCDATA)>
    	<!ELEMENT age (#PCDATA)>
    	<!ELEMENT contact (phone|email)>
    	<!ELEMENT br EMPTY>
    	<!ATTLIST person
    	  pid ID #REQUIRED
    	  sex (男|女) '男'
    	  qq CDATA #IMPLIED
    	  parent IDREF #IMPLIED
    	>
    ]>
    <persons>
    	<person pid="p1" sex="男" qq="aaa" parent="p2">
    		<name>张小明</name>
    		<age>10</age>
    		<contact>
    			<phone>1234567</phone>
    		</contact>
    		<br/>
    	</person>
    	<person pid="p2">
    		<name>张大明</name>
    		<age>35</age>
    		<contact>
    			<email>123@qq.com</email>
    		</contact>
    	</person>
    </persons>

    4.5.XML语法-CDATA节
    假如有这么一个需求,需要通过XML文件传递一幅图片,怎么做呢?其实我们看到的电脑上的所有文件,本质上都是字符串,不过它们都是特殊的二进制字符串。我们可以通过XML文件将一幅图片的二进制字符串传递过去,然后再解析成一幅图片。那么这个字符串就会包含大量的<,>,&或者“等一些特殊的不合法的字符。这时候解析引擎是会报错的。

    所以,有些内容可能不想让解析引擎解析执行,而是当做原始内容处理,用于把整段文本解释为纯字符数据而不是标记。这就要用到CDATA节。

    语法如下:

    <![CDATA[
     
    ......
     
    ]]>

    CDATA节中可以输入任意字符(除]]>外),但是不能嵌套!

    如下例,这种情况它不会报错,而如果不包含在CDATA节中,就会报错:

    <stu id="001">
     
    <name>杨过</name>
     
    <sex>男</sex>
     
    <age>20</age>
     
    <intro><![CDATA[ad<<&$^#*k]]></intro>
     
    </stu>

    4.7.XML语法-注释

  • XML的注释类似于HTML中的注释:
    <!--这是一个注释-->

  • (1)注释内容不要出现-- 
  • (2)不要把注释放在标记中间; 
    (3)注释不能嵌套 
    (4)可以在除标记以外的任何地方放注释

                  

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值