常用的解析方式有三种:
1 DOM:要求解析器把整个xml文档装载到内存,并解析成一个document对象
优点:元素与元素之间保留结构关系,可以进行增删查改操作
缺点:xml过大,可能造成内存溢出
2 SAX:一种速度更快,更有效的方法,一边扫描文档一边解析。并以事件驱动的方式进行解析,每执行一行,都将触发对应的事件。
优点:处理速度快,可以处理大文件
缺点:只能读,不能进行增删查改操作
3.pull:多用于android
根据3中解析方式把繁琐的解析器(api)变为解析开发包(简化api)
常用的解析开发包
JAXP:sun公司提供,支持DOM和SAX的开发包
jDom:dom4j兄弟
jsoup:一种处理HTML特定解析包
dom4j:比较常用的解析开发包。hibernate底层采用
使用dom4j演示例子
try {
//1.获取解析器
SAXReader saxReader = new SAXReader();
//2.获取document文档对象
Document doc = saxReader.read("src/com/lbx/xml/schema/web.xml");
//获取根元素
Element rootElement = doc.getRootElement();
//System.out.println(rootElement.getName);//获取根元素的名称
//System.out.println(rootElement.attributeValue("version")); //获取根元素里面的属性值
//获取根元素里面的元素集(elements())
List<Element> childElement = rootElement.elements();
for (Element element : childElement) {
//System.out.println(element.getName());
//判断元素中有name为servlet的元素
if("servlet".equals(element.getName())) {
List<Element> list = element.elements();
for (Element el : list) {
//System.out.println(el.getText());
}
//获取element中有name为servlet-name的元素,并输出里面的文本
Element servletName = element.element("servlet-name");
System.out.println(servletName.getText());
Element servletClass = element.element("servlet-class");
System.out.println(servletClass.getName());
}
}
} catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}