XML 简介
XML(Extensible Markup Language)是一种类似于 HTML,但是没有使用预定义标记的语言。因此,可以根据自己的设计需求定义专属的标记。这是一种强大将数据存储在一个可以存储、搜索和共享的格式中的方法。最重要的是,因为 XML 的基本格式是标准化的,如果你在本地或互联网上跨系统或平台共享或传输 XML,由于标准化的 XML 语法,接收者仍然可以解析数据。
可以将XML的概念总结为以下几点:
-
是一种很像超文本标记语言的标记语言。
-
它的设计宗旨是传输数据,而不是显示数据。
-
它的标签没有被预定义。您需要自行定义标签。
-
它被设计为具有自我描述性。
-
它是W3C的推荐标准。
-
是各种应用程序之间进行数据传输的最常用的工具。
元素
元素由开始标签,结束标签和元素内容组成。元素内容指开始标签和结束标签之间的内容,可以包含子元素,字符数据等。
元素的命名规则如下
- 名称中可以包含字母数字,或者其他符号。
- 名称不能一数字或标点符号开始是。
- 名称不能以字符“”XML“(或者XML,XmL)开始。
- 名称不能包含空格
根元素
根元素的特点
- 根元素是一个完全包括文档中其他所有元素的元素。
- 根元素的起始标签要放在所有其他元素的起始标签之前。
- 根元素的结束标签要放在所有其他元素的结束标签之后。
xml中的特殊字符的处理
文档要求
XMl的应用
xml的应用场景主要体现在以下几点
- 数据存储
- 数据交换
- 数据配置
XML解析
目前常用的解析技术有四种
1.DOM
DOM把XML文件映射成一颗倒挂的数,已根元素为根节点,每一个节点都已对象形式存在,通过存取这些对象就能存取XML文档的内容
2.SAX
SAX是基于时间的解析,他是解决DOM解析的资源消耗而出现的,它不像DOM那样需要建立一颗完整的文档树,而是通过时间处理器完成对文档的解析, 以为SAX解析不用事先调入整个文档,所以他的优势就是占用资源少,消耗内存小,一般在解析数据量大的XML文档是会采用。