1、XML解析概述
当将数据存储在XML后,我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的10知识是可以完成的,不过你需要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,并提交对应的解析器,方便开发人员操作XML。
2、解析方式和解析器
开发中比较常见的解析方式有三种, 如下:
1)、DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。
a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b) 缺点: XML文档过大, 可能出现内存溢出显现。
2)、SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)
a) 优点:处理速度快,可以处理大文件
b) 缺点:只能读,逐行后将释放资源。
3)、PULL: Android内置的XML解析方式,类似SAX。(了解)
解析器;
就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
常见的解析开发包:
(1)、JAXP:sun公司提供支持DOM和SAX开发包
(2)、JDom: dom4j 兄弟
(3)、jsoup:一种处理HTML特定解析开发包
(4)、dom4];比较常用的解析开发包,hibernate 底层采用。
3、DOM解析原理及结构模型
XML DOM和HTML DOM类似,XML DOM将整个XML文档加载到内存,生成一个 DOM树,并获得一个Document对象,通过Document对象就可以对DOM进行操作
4、API使用
导入jar包:
dom4j必须使用核心类SaxReader加载xml文档获得Document,通过Document对象获得文档的根元素,然后就可以操作了。
常用API如下:
1.SaxReader对象
a)red..加载执行xml文档
2.Document对象
a)getRootElement()获得根元素
3.Element对象
a)elements..获得指定名称的所有子元素。可以不指定名称
b)element(..)获得指定名称第一个子元素。可以不指定名称
c)getName()获得当前元素的元素名
d)attributeValu..获得指定属性名的属性值
e)elementex.)获得指定名称子元素的文本值
f)getText()获得当前元素的文本内容
例:
public class TestDom4j {
@Test
public void test() {
try {
// 1.获得解析器
SAXReader saxReader = new SAXReader();
// 2.获得Document文本对象
Document document = saxReader.read("src/web.xml");
// 3.获得根节点
Element rootElement = document.getRootElement();
System.out.println(rootElement.getName()); // 输出根节点名
System.out.println(rootElement.attributeValue("version")); // 输出根节点version属性值
// 4.获取全部子节点
List<Element> elements = rootElement.elements();
// 5.遍历子节点
for (Element child : elements) {
// 判断元素名称,进入if操作
if ("servlet".equals(child.getName())) {
// 获得servlet-name节点
Element servletName = child.element("servlet-name");
// 输出servlet-name值
System.out.println(servletName.getText());
// 获得servlet-class节点
Element servletClass = child.element("servlet-class");
// 输出servlet-name值
System.out.println(servletClass.getText());
}
}
} catch (DocumentException e) {
e.printStackTrace();
}
}
}