DOM Document Object Model 文档对象模型
SAX Simple API for XML 来自开源社区
1.DOM 解析原理:讲文档加载到内存中形成树形结构
| 所有标签:封装成一个对象Element |
| 所有的文本:封装成一个对象Text |
| 所有的属性:封装成一个对象Attribute |
| 整个文档:封装成一个对象Document |
| 所有的元素属性文本标签统称为节点Node 文档对象也是一个Node |
2.SAX事件驱动的模式 一边读一边解析
3.解析的方式 CRUD
JAXP | Sun公司官方针对这两种解析方式提供的API | Javax.xml.parsers |
DOM4J | 开源组织针对这两种技术提供的API
|
|
JDOM | 开源组织提供的解析方式 |
|
4.JAXP(Java API for XML Processing)
Org.w3c.dom:提供DOM方式解析XML标准接口
Org.w3c.sax:提供sax方式解析XML的标准接口
Javax.xml:提供了解析xml文档的类
Javax.xml.parsers包中,定义了工厂类,通过调用工厂类得到针对xml文档进行解析的DOM和SAX解析器对象
DocumentBuilderFactory SAXParserFactory
5.DOM 解析
Javax.xml.parsers包中DocumentBuilderFactory类中的newInstance()方法得到工厂对象
DOM | DocumentBuildetFactory factory=DocumentBuilderFactory.newInstance(); |
调用对象newDocumentBuilderFactory得到DOM解析器对象
DOM | DocumentBuilder builder=factory.newDocumentBuilder() |
|
|
调用DOM解析器对象的parse()方法解析xml得到Document对象后操作整个xml文档
DOM | Document document=builder.parse("xml文档文件路径") |
获得相应的节点 NodeList nodlist=document.getElementByTagName("标签元素")
创建新的节点 createElement("标签名") 设置文本内容:setTextContent("内容")
接口NodeList中的方法 item(int index) getTextContent()获取节点的内容 appendChild()
6.DOM中节点之间的关系
位于同一个节点之上的节点是该节点的父节点(Parent),反之,位于节点之下的节点称之为子节点(Child)
同一层次,具有相同节点的节点是兄弟节点(Sibling)
一个节点的下一层的节点集合时节点的后代(descendant)
父祖父节点及所有位于节点上面的都是节点的祖先(ancestor)
7.回写更新xml文档
A:Javax.xml.transform包中的Transformer类用于把代表xml文件的Document对象转换为某种格式后进行输出
| TransformerFactory tFactory=TransformerFactory.newInstance(); |
| Transformer transformer=tFactory.newTransformer(); |
B: Transformer类通过transformer方法完成操作,该方法接收一个源和目的
| Javax.xml.transform.dom.DOMSource类来关联要转化的document对象 |
| Javax.xml.transform.stream.streamResult对象来表示数据目的地 |
| Transformer.transform(new DOMSource(document),new StreamResult("xml文件目的地")) |
8.Jaxp SAX 解析方式 基于事件驱动的方式
startElement()回调在每次SAX解析器遇到元素的起始标记是被调用
Characters()回调为字符数据所调用
endElement()为元素的结束标记所回调,并提供所有回调方法默认的空实现
A:通过SAXParserFactory创建SAX解析工厂 SAXParserFactory factory=SAXParserFactory.newInstance();
B:通过SAX解析器工厂的解析器对象 SAXParser parser=factory.newSAXParser();
C:通过解析器对象解析xml文档 parser.parse("xml文件名",new MyHandler())
这里MyHandler类继承DefaultHandler并重写了startElement,characters和endElement这三个方法
9.DOM4J解析方式 需要导入jar包
a | 创建解析器 SAXReader reader=new SAXReader();
解析xml文档 Document document=reader.read("xml文档文件路径");
|
b | 解析xml形式文本,得到document对象 String text="<members></members>"; Document document=DocumentHelper.parseText(text); |
c | 主动创建document对象 Document document=DocumentHelper.createDocument(); 创建根节点 Element roo=document.addElement("members"); |
获得文档的根节点 Element root=document.getRootElement();
获取摸个节点的子节点 Element element=node.element("标签名");
取得节点的文字 String text=node.getText();
取得某节点下所有名为“member”的子节点,并遍历
List nodes=root.elements("member"); 设置节点文字 element.setText("内容");
删除某节点 父节点.remove(子节点);
root.element(标签名).element(子标签名).getText(); 获取
root.element(标签名).addElement().setText(); 添加
DOM4J的更新回写
OutpuformatFormat=Outputformat.createPrettyPrint();
Format.setEncoding("UTF-8");
XMLWriter writer=new XMLWriter(new FileWriter("xml文件路径"),format);
Writer.write(document);
Writer.close();