其实那,xml有两种解析规范
- dom:把整个xml文档作为对象放到内存中,每个标签即其属性都被解析成对象。(很有面向对象的思想,一切都是对象)
- sax:一行一行的读。(这其实很人读是一样的,这一行是起始标签、还是内容、还是结束标签……)
SAX和DOM的比较
JAXP(Java API for XMLProcessing,意为XML处理的Java API)
用到了javax.xml.parsers这个包下面的四个类
JAXP的dom解析方式:
1)创建解析器的创建工厂,DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
2)创建解析器,
DocumentBuilder builder = factory.newDocumentBuilder();
3)解析xml文档,生成document对象。
Document document = builder.parse(String xmlpath);
4)再使用Document和Node、Element的方法来对Document进行操作
JAXP的dom写回方式:
1)创建工厂TransformerFactory。TransformerFactory factory2= TransformerFactory.newInstance();
2)创建写回转换器Transformer。
Transformer transformer = factory2.newTransformer();
3)调用写回方法。
transformer.transform(new DOMSource(document), new StreamResult(output));
*new DOMSource(document)
是把document作为输入流。
*new StreamResult(output)
是把文件输出流作为结果流。JAXP的sax解析
1)创建解析SAX工厂。SAXParserFactory factory = SAXParserFactory.newInstance();
2)创建SAX解析器。
SAXParser parser = factory.newSAXParser();
3)创建XML读取器。
XMLReader reader = parser.getXMLReader();
4)设置事件处理器(需要程序员自己编写处理器)。
reader.setContentHandler(handler);
5)进行文档解析。
reader.parse("xml/book.xml");
SAX解析的根本是编写处理器
在org.xml.sax中handler全是接口,有ContentHandler、DTDHandler、EntityHandler、ErrorHandler,分别用来接受文档内容、DTD内容、实体内容、错误的事件的通知。
为了便于开发,在org.xml.sax.helpers中,有一个DefaultHandler类,这个类实现了上面所有的接口。而且,我们编写自己的处理器时,只需要实现相应的方法即可,不需要全部实现。
下面给出了一个将xml封装成对象SAX实现,(好像让SAX干了DOM的事,狗拿了耗子。不打紧~重要的是学用法~)
SAX解析程序:
import java.util.ArrayList;
import java.util.List;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
public class Demo2
{
public static void main(String args[]) throws Exception
{
// 创建工厂
SAXParserFactory factory = SAXParserFactory.newInstance();
// 创建SAX解析器
SAXParser parser = factory.newSAXParser();
// 创建读取器
XMLReader reader = parser.getXMLReader();
// 设置事件处理器
JavaBeanHandler handler = new JavaBeanHandler();
reader.setContentHandler(handler);
// 进行文档解析
reader.parse("xml/book.xml");
List<Book> l = handler.getList();
}
}
/**
* 将书封装到list集合中
*
* @author majin
*
*/
class JavaBeanHandler extends DefaultHandler
{
private List<Book> list = new ArrayList<>();
private Book book = null;
private String current = null;
//解析到了标签的开始
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException
{
current = qName;
if ("书".equals(qName))
{
book = new Book();
}
}
//解析到了标签的内容
@Override
public void characters(char[] ch, int start, int length) throws SAXException
{
String content = new String(ch, start, length);
if ("书名".equals(current))
{
book.setName(content);
} else if ("作者".equals(current))
{
book.setAuthor(content);
} else if ("售价".equals(current))
{
book.setPrice(content);
}
}
//解析到了标签的结束
@Override
public void endElement(String uri, String localName, String qName) throws SAXException
{
if ("书".equals(qName))
{
list.add(book);
book = null;
}
current = null;
}
public List<Book> getList(){
return list;
}
}
================================
Book对象
public class Book
{
private String name = null;
private String author = null;
private String price = null;
//其相应的getter和setter省去
}
========================
book.xml的内容
<?xml version="1.0" encoding="UTF-8"?>
<书架>
<书>
<书名>javaWeb开发</书名>
<作者>java</作者>
<售价>100元</售价>
</书>
<书>
<书名>java入门到光头</书名>
<作者>java</作者>
<售价>100元</售价>
</书>
</书架>