XML注重数据本身
XML基础:自定义标记
标准化、规范化:DTD,Schema(解析,标签,属性)
命名空间:自定义标签,重名(name,指定属于哪一个空间)
文档显示:CSS,XSL(Xpath),XSLT(html,xml,…)
查询:XQuery
文档解析:JSP,JAVA
XML
XML:可扩展标记语言 扩展名:.xml
大小写敏感
一个XML文档有且只能有一个根元素/根标记
XML本身是一种元语言
HTML与XML的区别:
HTML | XML | |
---|---|---|
功能 | 用于数据显示 | 用于描述数据和保存数据 |
标记 | 标记是固定不变的 | 没有固定标记,根据实际需要进行定义,XML本身是一种元语言 |
语法 | 语法要求很宽松 | 有严格的语法要求 |
XML文档的分类:
格式不良好的XML文档
格式良好的XML文档(F7)
有效的的XML文档(F8)
XML文档在逻辑上主要有以下5个部分组成:
XML声明、文档类型声明、处理指令、注释、元素。
XML声明:
<?xml version=”1.0” encoding=”UTF-8” standalone="yes"?>
<!--encoding属性可以省略-->
<!--standalone属性可以省略,指定该XML文档是否和一个外部文档配套使用。该属性为yes时说明当前XML文档是一个独立的XML文档,与外部文件无关联;当省略该属性时,默认值为yes-->
文档类型声明:
<!DOCTYPE root SYSTEM “mydtd.dtd”>
<!--外部声明,SYSTEM:自定义验证文件-->
处理指令(Processing Instructions,PI):
<?xml-stylesheet type=”text/css” href=”mycss.css” ?>
注释:
<!- -我是注释- ->
元素:
<student>student1<student>
XML基本语法规则:
1)在XML中,包含单标记和双标记
2)所有标签区分大小写
3)所有标签必须符合标签命名规则,XML标签中允许使用中文。
4)应有较好的命名习惯,注意名字具有描述性
5)所有标签必须合理嵌套
6)所有标签的属性值必须用双引号或者单引号括起来,两者不能混合使用
7)XML有且只能有一个根元素
元素的内容可以包含子元素、字符数据、字符引用和实体引用、CDATA段、空白处理、行尾处理、语言标识。
XML的预定义的字符引用和实体引用
字符 | 字符引用 (十进制代码) | 字符引用 (十六进制代码) | 预定义实体引用 |
---|---|---|---|
< | < | < | < |
> | > | > | > |
" | " | " | " |
’ | ' | ' | ' |
& | & | & | & |
空白处理
在XML规范中,空白包括空格、制表符和空行。
可以在元素中使用一个特殊的属性“xml:space”来保留此元素中的空白。
xml:space接受default和preserve两个值
- default:允许应用程序根据需要处理空白(如果没有xml:space,默认为此)。
- preserve:按原样保留空白,空白可能有含义。