1.在js使用dom解析标记型文档,根据html的层级结构,在内存中分配一个树形结构,把html 的标签属性和文本都封装成对象,document对象,element对象,属性对象,文本对象,node节点对象。
2.xml的解析方式:dom和sax
dom解析: 使用dom方式解析xml的时候,如果文件过大,造成内存溢出,但是很方便实现增删改操作。
sax解析:采用事件驱动,边读边解析, 从上到下,一行一行的解析,解析到某一个对象,把对象的名称返回。不会造成内存溢出,可以方便实现查询,不能够做增删改操作。
3.想要解析xml,首先需要一个解析器,不同的公司和组织提供了针对dom和sax方式的解析器,通过api方式提供。
sun公司提供了针对dom和sax 解析器,jaxp
dom4j组织,针对dom和sax解析器,dom4j(实际开发中使用最多的)
jdom组织,针对dom和sax解析器,jdom
4.jaxp的api查看
jaxp是javase的一部分, jaxp解析器在jdk的javax.xml.parsers包里面
四个类分别是针对dom和sax解析使用的类,
dom解析:
- DocumentBuilder:解析器类。这个类是一个抽象类, 不能new,想要得到这个类,可以使用 DocumentBuilderFactory.newDocumentBuilder()方法获取。
- DocumentBuilderFactoty :解析器工厂
这个类也是一个抽象类,不能new,可以通过newInstance()获取实例。
一个方法,可以解析xml,parse(“xml路径”)返回的是document整个文档。
返回的是document是一个接口,父节点是Node,如果在document里面找不到想要的方法, 到Node节点里面去找。在document方法,getElementsByTagName(String tagname)这个方法可以得到标签,返回集合,NodeList。常用的方法主要有:
creatElement(String tagName)创建标签
createTextNode(String data)创建文本
appendChild(Node newChild)把文本添加到标签下面
re moveChild()删除节点
replace()替换节点
getParentNode()获取到父节点
实例如下:
首先创建一个简单的xml文件:
<?xml version="1.0" encoding="UTF-8" standalone="no"?><person>
<p1>
<name>zhangsan</name>
<age>23</age>
<sex>nv</sex>
</p1>
<p1>
<name>lisi</name>
<age>24</age>
</p1>
</person>
再利用jaxp解析器进行解析,解析过程如下:
- 首先点击src右键选择并创建一个package包,如图:
- 再点击包名右键选择创建一个类。
此时在创建的类中写入解析器解析的代码,即可对xml文档进行操作。可实现 查询所有name元素值,
查询第一个name元素值,使用jaxp添加节点,使用jaxp改写节点,使用jaxp删除节点,使用jaxp遍历节点。
具体的代码如下:
package cn.itcast.jaxp;
import java.io.IOException;
import javax.lang.model.element.Element;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;
import org.xml.sax.SAXException;
public class TestJaxp {
public static void main(String[] args) throws Exception
{
// 查询所有name元素值
selectAll();
//查询第一个name元素值
selectSin();
//使用jaxp添加节点
addSex();
//使用jaxp改写节点
modifySex();
//使用jaxp删除节点
delSex();
//使用jaxp遍历节点
listElement();
}
public static void selectSin() throws Exception{
/*
* 创建解析器工厂
* 创建解析器
* 解析xml,返回document
* 得到所有name元素
* 使用返回集合,里面方法item,下标获取具体元素
* 得到具体的值, 使用getTextContent方法
*/
DocumentBuilderFactory builderFactory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=builderFactory.newDocumentBuilder();
Document document=builder.parse("src/person.xml");
NodeList list=document.getElementsByTagName("name");
Node name1=list.item(0);
String s1=name1.getTextContent();
System.out.println(s1);
}
private static void selectAll() throws Exception
{
//操作注释
//创建解析器工厂,根据解析器工厂创建解析器,解析xml返回document,获取节点,得到name标签文本值
DocumentBuilderFactory builderFactory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=builderFactory.newDocumentBuilder();
Document document=builder.parse("src/person.xml");
NodeList list=document.getElementsByTagName("name");
for(int i=0;i<list.getLength();i++){
Node name1=list.item(i);
String s=name1.getTextContent();
System.out.println(s);
}
}
public static void addSex() throws Exception{
DocumentBuilderFactory builderFactory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=builderFactory.newDocumentBuilder();
Document document=builder.parse("src/person.xml");
NodeList list=document.getElementsByTagName("p1");
Node p1=list.item(0);
org.w3c.dom.Element sex1=document.createElement("sex");
Text text1=document.createTextNode("nv");
sex1.appendChild(text1);
p1.appendChild(sex1);
//回写xml
TransformerFactory transformerFactory=TransformerFactory.newInstance();
Transformer transformer=transformerFactory.newTransformer();
transformer.transform(new DOMSource(document),new StreamResult("src/person.xml"));
}
public static void modifySex() throws Exception{
DocumentBuilderFactory builderFactory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=builderFactory.newDocumentBuilder();
Document document=builder.parse("src/person.xml");
NodeList list=document.getElementsByTagName("sex");
Node sex1=list.item(0);
sex1.setTextContent("nan");
//回写xml
TransformerFactory transformerFactory=TransformerFactory.newInstance();
Transformer transformer=transformerFactory.newTransformer();
transformer.transform(new DOMSource(document),new StreamResult("src/person.xml"));
}
public static void delSex() throws Exception{
DocumentBuilderFactory builderFactory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=builderFactory.newDocumentBuilder();
Document document=builder.parse("src/person.xml");
NodeList list=document.getElementsByTagName("sex");
Node sex1=list.item(1);
Node node1=sex1.getParentNode();
node1.removeChild(sex1);
//回写xml
TransformerFactory transformerFactory=TransformerFactory.newInstance();
Transformer transformer=transformerFactory.newTransformer();
transformer.transform(new DOMSource(document),newStreamResult("src/person.xml"));
}
public static void listElement() throws Exception{
DocumentBuilderFactory builderFactory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=builderFactory.newDocumentBuilder();
Document document=builder.parse("src/person.xml");
list1(document);
}
private static void list1(Node node) {
// TODO Auto-generated method stub
///判断是否为元素节点,即不输入文本节点。
if(node.getNodeType()==Node.ELEMENT_NODE){
System.out.println(node.getNodeName());
}
NodeList list=node.getChildNodes();
for(int i=0;i<list.getLength();i++){
Node node1=list.item(i);
//运用了递归算法进行遍历
list1(node1);
}
}
}