1、XML解析概述
当被数据存储在xml后,我们就希望通过程序获得XML的内容。如果我们使用Java基础所学习的IO知识是可以完成的,不过需要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,并提交对应的解析器,方便开发人员操作XML。
2、解析方式和解析器
2.1、开发中比较常见的解析方式有3种,如下:
1)、DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象。
a)、优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b)、缺点:XML文档过大,可能出现内存溢出现象。
2)、SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件。
a)、优点:处理速度快,可以处理大文件。
b)、缺点:只能读,逐行后将释放资源。
3)、PULL:Android内置的XML解析方式,类似SAX。
2.2、解析器:就是根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
2.3、 常见的解析开发包
* JAXP :sun公司提供,支持DOM和SAX开发包
* JDom : dom4j兄弟
* jsoup : 一种处理HTML特定解析开发包
* dom4j : 比较常见的解析开发包,hibernate底层采用
3、API使用
如果需要使用dom4j,必须导入jar包
dom4j必须使用核心类SaxReader加载xml文档获得Document,通过Document对象获得文档的根元素,然后就可以操作了。
@Test
public void testReadWebXML() {
try {
// 1.获取解析器
SAXReader saxReader = new SAXReader();
// 2.获得document文档对象
Document doc = saxReader.read("src/cn/itheima/xml/schema/web.xml");
// 3.获取根元素
Element rootElement = doc.getRootElement();
// System.out.println(rootElement.getName());//获取根元素的名称
// System.out.println(rootElement.attributeValue("version"));//获取根元素中的属性值
// 4.获取根元素下的子元素
List<Element> childElements = rootElement.elements();
// 5.遍历子元素
for (Element element : childElements) {
//6.判断元素名称为servlet的元素
if ("servlet".equals(element.getName())) {
//7.获取servlet-name元素
Element servletName = element.element("servlet-name");
//8.获取servlet-class元素
Element servletClass = element.element("servlet-class");
System.out.println(servletName.getText());
System.out.println(servletClass.getText());
}
}
} catch (DocumentException e) {
e.printStackTrace();
}
}