XML概述:
XML格式文件能够表示层次结构,不同结构中的相同属性不会被曲解。XML大小写敏感。XML必须具有结束标签,不可省略。PS:单标签必须以“/结尾”,比如<img/>XML中属性值必须用引号括起来,且属性名可以必须进行赋值。
XML文档结构:
XML文档应该以一个文档头开始,例如:<?xml version="1.0"?> 或者<?xml version="1.0" encoding="UTF-8" ?>文档头之后通常是文档类型的定义(Document Type Definition,DTD),文档类型定义是确保文档正确的一个重要机制,但是它并不是必需的。XML文档包含根元素,根元素包含其他元素,每个元素都可以包含其子元素、文本或两者有之。(应尽量避免混合式内容,即两者有之,有利于简化xml文档的解析过程)XML中属性较简单,元素灵活性以及扩展性较好。属性尽量应该用来修改值的解释,元素用来指定值XML文档中,除元素和文本外其他的标记:
字符引用:十进制值(&#)、十六进制值(&#x)实体引用:通俗来讲就是转义的特殊字符。形式是&name。 比如:< 表示小于号CDATA:CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束:,是字符数据的一种特殊形式。CDATA 部分中的所有内容都会被解析器忽略。但CDATA 部分不能包含字符串 "]]>"。也不允许嵌套的 CDATA 部分。标记 CDATA 部分结尾的 "]]>" 不能包含空格或折行。处理命令:<? ?>,用来指挥解析引擎如何xml文档内容。注释:<!-- -->,注释不能含有--字符串。
XML文档解析:
Java库提供了两种XML解析器:
1.像文档对象模型(DOM)解析器 -- 树形解析器,该解析器将读入 的XML文档和转换成树结构
2.像XML简单API(SAX)解析器 -- 流机制解析器 ,该解析器在读入XML文档是生产相应的事件