XML解析方式
DOM解析: DOM4J:第三方jar包 实现了DOM思想。
dom4j在处理XML的时候,我们需要读入整个的XML文档,然后在内存中创建DOM树,生成DOM树上 的每个NODE对象。当文档比较小的时候,这不会造成什么问题,但是一旦文档大起来,处理DOM就会变得相当费时费力。特别是其对于内存的需求,也将是成 倍的增长,以至于在某些应用中使用DOM是一件很不划算的事。
SAX解析:
它是事件驱动的, 也就是说,它并不需要先读入整个文档,文档的读入过程也就是SAX的解析过程。
所谓事件驱动,是指一种基于回调(callback)机制的程序运行方法。 在XMLReader接受XML文档,在读入XML文档的过程中就进行解析,也就是说读入文档的过程和解析的过程是同时进行的
1)获取SAXParserFactory解析工厂。
2)根据SAXParserFactory对象获取SAXParser对象。
3)创建继承自DefaultHandler的解析处理器:
startDocument()方法:文档根标签开始,初始化集合使用
startElement()方法:文档标签开始,初始化集合中对象
endElement():文档标签结束,集合中添加对象
characters():获取标签中的文本,包括空格
4)使用SAXParser对象的parse()方法进行解析,传入xml文档和解析处理器对象。
例:
SAXParserFactory sf = SAXParserFactory.newInstance();
List<User> uList = new ArrayList<>();
try {
//2.使用工厂创建解析器
SAXParser parser = sf.newSAXParser();
//3.读取xml文档
//4.设置事件处理器
parser.parse("info.xml", new MyContentHandler(uList));
} catch (ParserConfigurationException e) {
// TODO 自动生成的 catch 块
e.printStackTrace();
} catch (SAXException e) {
// TODO 自动生成的 catch 块
e.printStackTrace();
} catch (IOException e) {
// TODO 自动生成的 catch 块
e.printStackTrace();
}
System.out.println(uList);
SAX的优点:
解析速度快
占用内存少
SAX的缺点:
无法知道当前解析标签(节点)的上层标签,及其嵌套结构,仅仅知道当前解析的标签的名字和属性,要知道其他信息需要程序猿自己编码
pull解析
1 创建工厂XmlPullParserFactory
2 使用工厂创建解析器
3 设置解析器的输入流
4 获取事件类型
5 循环利用解析器解析XML文档
6 切记需要parser.next()手动触发下一个事件
例:
// 构建XmlPullParserFactory
XmlPullParserFactory pf = XmlPullParserFactory.newInstance();
// 获取XmlPullParser实例
XmlPullParser xp = pf.newPullParser();
// 解析文件
xp.setInput(new FileInputStream("info.xml"), "utf-8");
// 开始:获取解析的事件类型
int eventType = xp.getEventType();
List<User> uList = new ArrayList<>();
User u = null;
// 判断文件解析的是否完毕
while (eventType != XmlPullParser.END_DOCUMENT) {
//通过getName判断读到哪个标签,
String nodeName = xp.getName();
switch (eventType) {
// 开始节点
case XmlPullParser.START_TAG:
if (nodeName.equals("user")) {
u = new User();
//通过getAttributeValue(i)获取属性节点值
u.setId(Integer.valueOf(xp.getAttributeValue(0)));
} else if (nodeName.equals("name")) {
u.setName(xp.nextText());
// 如果后面是Text元素,即返回它的值
} else if (nodeName.equals("password")) {
u.setPassword(xp.nextText());
}
break;
// 结束节点
case XmlPullParser.END_TAG:
if (nodeName.equals("user")) {
uList.add(u);
u = null;
}
break;
}
// 手动的触发下一个事件
eventType = xp.next();
}
System.out.println(uList);
}
DOM解析: DOM4J:第三方jar包 实现了DOM思想。
dom4j在处理XML的时候,我们需要读入整个的XML文档,然后在内存中创建DOM树,生成DOM树上 的每个NODE对象。当文档比较小的时候,这不会造成什么问题,但是一旦文档大起来,处理DOM就会变得相当费时费力。特别是其对于内存的需求,也将是成 倍的增长,以至于在某些应用中使用DOM是一件很不划算的事。
SAX解析:
它是事件驱动的, 也就是说,它并不需要先读入整个文档,文档的读入过程也就是SAX的解析过程。
所谓事件驱动,是指一种基于回调(callback)机制的程序运行方法。 在XMLReader接受XML文档,在读入XML文档的过程中就进行解析,也就是说读入文档的过程和解析的过程是同时进行的
1)获取SAXParserFactory解析工厂。
2)根据SAXParserFactory对象获取SAXParser对象。
3)创建继承自DefaultHandler的解析处理器:
startDocument()方法:文档根标签开始,初始化集合使用
startElement()方法:文档标签开始,初始化集合中对象
endElement():文档标签结束,集合中添加对象
characters():获取标签中的文本,包括空格
4)使用SAXParser对象的parse()方法进行解析,传入xml文档和解析处理器对象。
例:
SAXParserFactory sf = SAXParserFactory.newInstance();
List<User> uList = new ArrayList<>();
try {
//2.使用工厂创建解析器
SAXParser parser = sf.newSAXParser();
//3.读取xml文档
//4.设置事件处理器
parser.parse("info.xml", new MyContentHandler(uList));
} catch (ParserConfigurationException e) {
// TODO 自动生成的 catch 块
e.printStackTrace();
} catch (SAXException e) {
// TODO 自动生成的 catch 块
e.printStackTrace();
} catch (IOException e) {
// TODO 自动生成的 catch 块
e.printStackTrace();
}
System.out.println(uList);
SAX的优点:
解析速度快
占用内存少
SAX的缺点:
无法知道当前解析标签(节点)的上层标签,及其嵌套结构,仅仅知道当前解析的标签的名字和属性,要知道其他信息需要程序猿自己编码
pull解析
1 创建工厂XmlPullParserFactory
2 使用工厂创建解析器
3 设置解析器的输入流
4 获取事件类型
5 循环利用解析器解析XML文档
6 切记需要parser.next()手动触发下一个事件
例:
// 构建XmlPullParserFactory
XmlPullParserFactory pf = XmlPullParserFactory.newInstance();
// 获取XmlPullParser实例
XmlPullParser xp = pf.newPullParser();
// 解析文件
xp.setInput(new FileInputStream("info.xml"), "utf-8");
// 开始:获取解析的事件类型
int eventType = xp.getEventType();
List<User> uList = new ArrayList<>();
User u = null;
// 判断文件解析的是否完毕
while (eventType != XmlPullParser.END_DOCUMENT) {
//通过getName判断读到哪个标签,
String nodeName = xp.getName();
switch (eventType) {
// 开始节点
case XmlPullParser.START_TAG:
if (nodeName.equals("user")) {
u = new User();
//通过getAttributeValue(i)获取属性节点值
u.setId(Integer.valueOf(xp.getAttributeValue(0)));
} else if (nodeName.equals("name")) {
u.setName(xp.nextText());
// 如果后面是Text元素,即返回它的值
} else if (nodeName.equals("password")) {
u.setPassword(xp.nextText());
}
break;
// 结束节点
case XmlPullParser.END_TAG:
if (nodeName.equals("user")) {
uList.add(u);
u = null;
}
break;
}
// 手动的触发下一个事件
eventType = xp.next();
}
System.out.println(uList);
}