前面写了一篇博客介绍了java解析xml的方式之一DOM。但是使用DOM解析有一个问题,那就是DOM的解析是一次性把xml文档加载到内存里,然后在解析。那么问题就来了,当所需要解析的xml文档很大的时候内存可能就不够用。那么今天就介绍第二种解析xml文档的方式SAX
SAX解析xml文档的方式是一句一句的读入,并且一句一句的解析。这样就不存在内存不够用的情况了。
下面是SAX解析xml文档的步骤:
1、构建XMLReader对象
2、构建DefaultHandler对象(在这里可以创建一个内部类,并重写其中的StartElement、EndElement、characters方法。当然单独创建一个类也是可以的)
3、为XMLReader对象设置默认的处理器。
4、设置需要解析的xml文档。
OK,以上就是SAX解析的步骤,当然了仅仅只是以上的步骤看起来是非常难理解的。那么下面我们就来实现一个小例子。
下面是一个Student.xml文档
<?xml version="1.0" encoding="UTF-8"?>
<Students>
<Student name="zhangsan">
<age>22</age>
<height>176</height>
</Student>
<Student name="lisi">
<age>20</age>
<height>186</height>
</Student>
<Student name="wangwu">
<age>24</age>
<height>196</height>
</Student>
</Students>
我们的目的是要解析该xml文档,将学生的信息保存在一个集合中。下面就是具体的代码,附带有注释。
import java.io.FileInputStream;
import java.util.ArrayList;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
public class SAX {
public static void main(String[] args)
{
final ArrayList<Student> list = new ArrayList<Student>();//定义一个集合,用于保存学生信息,需要在内部类里使用所以定义为final类型
try {
XMLReader reader = SAXParserFactory.newInstance().newSAXParser().getXMLReader();//构建XMLReader对象
/*
* 以内部类的形式创建默认的处理器
* 下面重写的方法都是回调方法,在符合条件的情况下自动调用
*/
DefaultHandler handler = new DefaultHandler(){
StringBuilder builder = new StringBuilder();
String name = "";
int age = 0;
int height = 0;
Student stu = null;
@Override
public void startElement(String uri, String localName,
String qName, Attributes attributes)//读到开始标签是调用该方法
throws SAXException {
// TODO Auto-generated method stub
super.startElement(uri, localName, qName, attributes);
//名字是存在Student标签内的,所以读到Student标签的时候获取name
if("Student".equals(qName))
{
name = attributes.getValue("name");//通过attributes.getValue()方法获取属性值
}
builder = new StringBuilder();//将缓存值清空,以免下次读取的时候影响
}
@Override
public void endElement(String uri, String localName,//读取到结束标签的时候自动调用
String qName) throws SAXException {
// TODO Auto-generated method stub
super.endElement(uri, localName, qName);
if("age".equals(qName))
{
age = Integer.parseInt(builder.toString());
}else if("height".equals(qName))
{
height = Integer.parseInt(builder.toString());
}else if("Student".equals(qName))
{
//System.out.println(name + " Age:" + age + " Height:" + height);
stu = new Student(name,age,height);
list.add(stu);
}
}
@Override
public void characters(char[] ch, int start, int length)//解析到标签中值的时候自动调用
throws SAXException {
// TODO Auto-generated method stub
super.characters(ch, start, length);
builder.append(ch,start,length);
}
};
reader.setContentHandler(handler);//设置处理器
reader.parse(new InputSource(new FileInputStream("Student.xml")));//设置xml文档
for(Student s: list)//遍历集合输出学生信息
{
System.out.println(s.toString());
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
以上就是SAX解析的具体代码。
下面是学生类
public class Student {
private String name;
private int age;
private int height;
public Student(String name, int age, int height) {
super();
this.name = name;
this.age = age;
this.height = height;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
public int getHeight() {
return height;
}
public void setHeight(int height) {
this.height = height;
}
@Override
public String toString() {
return "Student [name=" + name + ", age=" + age + ", height=" + height
+ "]";
}
}
当然了,SAX虽然能解析较大的xml文档,但是也有其自身的缺陷,那就是它自能解析xml文档,不能对其进行修改