xml的解析:xml是标记型语言
xml的解析方法:dom和sax
使用dom和sax解析xml的解析过程:
dom解析分析:根据xml的层级结构,在内存中分配一个树形结构,把xml中的标签、属性和文本都封装成对象。
优点:对于增删改操作很方便。
缺点:如果xml文件过大,会造成文件的溢出。
sax解析分析:采用事件驱动,边读边解析
从上到下,一行一行的解析,解析到某个对象,把对象名称返回。
优点:不会造成内存溢出,实现查询
xml的解析方法:dom和sax
使用dom和sax解析xml的解析过程:
dom解析分析:根据xml的层级结构,在内存中分配一个树形结构,把xml中的标签、属性和文本都封装成对象。
优点:对于增删改操作很方便。
缺点:如果xml文件过大,会造成文件的溢出。
sax解析分析:采用事件驱动,边读边解析
从上到下,一行一行的解析,解析到某个对象,把对象名称返回。
优点:不会造成内存溢出,实现查询
缺点:不能实现增删改操作
xml示例:
<?xml version="1.0" encoding="UTF-8" standalone="no"?><person>
<student>
<name>张三</name>
<age>19</age>
</student>
<student>
<name>李四</name>
<age>20</age>
</student>
</person>
jaxp解析程序
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.ErrorListener;
import javax.xml.transform.Source;
import javax.xml.transform.Templates;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.URIResolver;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.w3c.dom.Text;
/**
* 解析xml
*
* @author My World
*
*/
public class Jaxp_Person {
public static void main(String[] args) throws Exception {
listElement(); //遍历每一个节点
//deleteSex();// 删除sex节点
// updataSex();// 修改sex节点
// addSex();//增加节点
// selectSingle();//查询指定的第一个节点
// selectAll();//查询所有节点
}
private static void listElement() throws Exception {
// 1、创建解析器工厂
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
// 2、通过解析器工厂,创建解析器
DocumentBuilder builder = builderFactory.newDocumentBuilder();
// 3、解析xml文档,返回Document
Document document = builder.parse("src/analysis/Person.xml");
//4、遍历节点,先获取子节点,通过子节点获取根节点
//可以通过遍历实现
list(document);
}
//递归遍历的方法
private static void list(Node node) {
//判断是否是Element,如果是就打印
if (node.getNodeType() == node.ELEMENT_NODE) {
System.out.println(node.getNodeName());
}
//得到一层子节点
NodeList list = node.getChildNodes();
for(int i = 0;i < list.getLength();i++){
//得到每一个节点
Node node1 = list.item(i);
list(node1);
}
}
private static void deleteSex() throws Exception {
// 1、创建解析器工厂
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
// 2、通过解析器工厂,创建解析器
DocumentBuilder builder = builderFactory.newDocumentBuilder();
// 3、解析xml文档,返回Document
Document document = builder.parse("src/analysis/Person.xml");
// 4、得到sex
Node sex = document.getElementsByTagName("sex").item(0);
Node student = sex.getParentNode();
student.removeChild(sex);
// 6、回写下xml
// 通过TransformerFactory中的静态方法newInstance()创建TransformerFactory工厂对象
TransformerFactory transformerFactory = TransformerFactory.newInstance();
// 通过TransformerFactory工厂对象中的newTransformer()方法,创建Transformer对象
Transformer transformer = transformerFactory.newTransformer();
// 通过transformer中的transform()方法把内存中的已经修改的xml文件回写进系统中的xml中
transformer.transform(new DOMSource(document), new StreamResult("src/analysis/Person.xml"));
}
/**
* 修改第一个student中的sex的值
*
* @throws Exception
*/
private static void updataSex() throws Exception {
// 1、创建解析器工厂
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
// 2、通过解析器工厂,创建解析器
DocumentBuilder builder = builderFactory.newDocumentBuilder();
// 3、解析xml文档,返回Document
Document document = builder.parse("src/analysis/Person.xml");
// 4、得到sex
Node sex = document.getElementsByTagName("sex").item(0);
// 修改sex的值
sex.setTextContent("男");
// 6、回写下xml
// 通过TransformerFactory中的静态方法newInstance()创建TransformerFactory工厂对象
TransformerFactory transformerFactory = TransformerFactory.newInstance();
// 通过TransformerFactory工厂对象中的newTransformer()方法,创建Transformer对象
Transformer transformer = transformerFactory.newTransformer();
// 通过transformer中的transform()方法把内存中的已经修改的xml文件回写进系统中的xml中
transformer.transform(new DOMSource(document), new StreamResult("src/analysis/Person.xml"));
}
/**
* 增加一个sex节点
*
* @throws Exception
*/
private static void addSex() throws Exception {
// 1、创建解析器工厂
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
// 2、通过解析器工厂,创建解析器
DocumentBuilder builder = builderFactory.newDocumentBuilder();
// 3、解析xml文档,返回Document
Document document = builder.parse("src/analysis/Person.xml");
// 4、得到student集合
NodeList nodeList = document.getElementsByTagName("student");
// 得到第一个student节点
Node student = nodeList.item(0);
// 创建sex标签
Element sex = document.createElement("sex");
// 创建标签文本
Text text = document.createTextNode("女");
// 把标签的文本添加到标签上
sex.appendChild(text);
// 把sex标签放入student节点上
student.appendChild(sex);
// 会写xml(很重要),上面虽然已经把sex标签添加进student节点了,但是那只是内存中的,xml文档中并没有改变
// 通过TransformerFactory中的静态方法newInstance()创建TransformerFactory工厂对象
TransformerFactory transformerFactory = TransformerFactory.newInstance();
// 通过TransformerFactory工厂对象中的newTransformer()方法,创建Transformer对象
Transformer transformer = transformerFactory.newTransformer();
// 通过transformer中的transform()方法把内存中的已经修改的xml文件回写进系统中的xml中
transformer.transform(new DOMSource(document), new StreamResult("src/analysis/Person.xml"));
}
/**
* 查询第一个student的name
*
* @throws Exception
*/
private static void selectSingle() throws Exception {
/**
* 1、创建解析器工厂 2、通过解析器工厂,创建解析器 3、解析xml文档,返回Document
*/
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = builderFactory.newDocumentBuilder();
Document document = builder.parse("src/analysis/Person.xml");
// 得到所有name的值,并使用item(0),获取NodeList集合中
Node name = document.getElementsByTagName("name").item(0);
String string = name.getTextContent();// 获取name节点具体的值
System.out.println(string);
}
/**
* 查询所有
*
* @throws Exception
*/
private static void selectAll() throws Exception {
/**
* 1、创建解析器工厂 DocumentBuilderFactory是一个抽象类,不能直接new,可以使用newInstance方法,
* 返回一个DocumentBuilderFactory对象
*/
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
/**
* 2、创建解析器 BuilderFactory解析器是一个抽象类,通过解析器工厂的newDocumentBuilder()创建解析器类
*/
DocumentBuilder builder = builderFactory.newDocumentBuilder();
/**
* 3、解析xml返回Document
*/
Document document = builder.parse("src/analysis/Person.xml");
/**
* 4、得到所有的name元素,通过getElementByTagName获取标签,与html相同
*/
NodeList nodeList = document.getElementsByTagName("name");
/**
* 5、遍历NodeList集合
*/
for (int i = 0; i < nodeList.getLength(); i++) {
// 得到node节点
Node name = nodeList.item(i);
System.out.println(name);
// 通过getTextContent()方法得到node里面的文本内容
System.out.println(name.getTextContent());
}
}
}