DOM方式解析XML文件
DOC解析编程:
查找某一个节点
// 查找固定值的书的元素的第二个子节点
public static voidfindFixedChildren(Document doc) {
//通过名字查找并返回一个集合
NodeList list =doc.getElementsByTagName("书名");
for (inti = 0; i < list.getLength(); i++) {
//通过Item()方法返回集合中的第i项
Node n = list.item(i);
System.out.println(n.getNodeName());
}
//查找书架中的子元素的第二个元素
int index =2;
//获取集合中的长度并判断,如果长度》2,说明有要找的那个元素,然后找出并输出
if(list.getLength() >= 2) {
Node bookname = list.item(index);
System.out.println(bookname.getNodeName() +bookname.getNodeType()+bookname.getNodeValue());
}
删除结点
// 删除节点
public static voiddeleteElement(Document doc) throws Exception {
// 获取要删除的那个节点对象
Node node =doc.getElementsByTagName("售价").item(1);
//getParentNode()是此节点的父节点
//removeChild() 从子节点列表中移除 oldChild 所指示的子节点,并将其返回。
node.getParentNode().removeChild(node);// removeChild
// 将内存中树状结构doc'写入到xml文档中
TransformerFactoryfactory = TransformerFactory.newInstance();
// 由工厂对象生成装换对象Transformer
Transformer trans =factory.newTransformer();
// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce
// 需要一个DOMSource对象来代表源树
trans.transform(newDOMSource(doc), new StreamResult(new File(
"src/Book.xml")));
}
注意:将内存中树状结构doc'写入到xml文档中,在其中,当调用transform方法时,有两个参数,分别为 Source和Resutl,但这两个数是接口,但必须在用的时候,要用实现了该接口的类才可以,所以用到了DOMSource 和StreamResult两个方法
TransformerFactory factory =TransformerFactory.newInstance()
Transformer trans =factory.newTransformer();
trans.transform(new DOMSource(doc), new StreamResult(newFile(
"src/Book.xml")));
添加节点
// 节点的添加
public static voidcreateElement(Document doc) throws Exception {
// 确定添加节点的位置,得到的是集合是父节点,通过标签名找,返回的是集合,要确定是哪个节点
Node book =doc.getElementsByTagName("书").item(0);
// 生成一个新节点
Element element =doc.createElement("出版社");
//element.setTextContent("清华大学");
Text text =doc.createTextNode("清华大学出版社");
element.appendChild(text);
// 在指定的位置把新生成的节点添加进去
book.appendChild(element);
// 将内存中树状结构doc'写入到xml文档中
TransformerFactoryfactory = TransformerFactory.newInstance();
// 由工厂对象生成装换对象Transformer
Transformer trans =factory.newTransformer();
// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce
// 需要一个DOMSource对象来代表源树
trans.transform(newDOMSource(doc), new StreamResult(new File(
"src/Book.xml")));
}
插入节点
public static voidcreateFileElement(Document doc) throws Exception {
// 确定插入点的位置
Node author =doc.getElementsByTagName("作者").item(0);
Node parent =author.getParentNode();// 指定插入到作者之前
//插入到author的后面
Node brothder =author.getNextSibling();
// 创建新节点
Element element =doc.createElement("出版社");
element.setTextContent("清华大学出版社");
// 插入节点,在书这个节点中在作者前插入
//parent.insertBefore(element, author);//()
parent.insertBefore(element, brothder);
// 将内存中树状结构doc'写入到xml文档中
TransformerFactoryfactory = TransformerFactory.newInstance();
// 由工厂对象生成装换对象Transformer
Transformer trans =factory.newTransformer();
// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce
// 需要一个DOMSource对象来代表源树
trans.transform(newDOMSource(doc), new StreamResult(new File(
"src/Book.xml")));
}
修改节点
public static voidupdateElement(Document doc) throws Exception {
// 获取要更新的对象
Node node =doc.getElementsByTagName("售价").item(0);
node.setTextContent("500");
// 修改属性
if (node instanceofElement) {
Element element = (Element) node;
Attr att = element.getAttributeNode("type");
att.setValue("美元");
}
// 将内存中树状结构doc'写入到xml文档中
TransformerFactoryfactory = TransformerFactory.newInstance();
// 由工厂对象生成装换对象Transformer
Transformer trans =factory.newTransformer();
// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce
// 需要一个DOMSource对象来代表源树
trans.transform(newDOMSource(doc), new StreamResult(new File(
"src/Book.xml")));
}
Node方法的总结:
(1)node.getNodeType() 得到的是节点的类型 元素节点类型是1 文本节点为 3
(2)node.getNodeValue() 元素的值为空 因为节点是Element,所有返回的是null
(3)得到元素中的内容的方法:
node.getTextContent()
Text text = (Text)node.getChildNoddes().item(0) Text.getNodeValues()
SAM解析xml文档
(1)SAM解析的优点:
SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。
(2)SAM解析的分析:
SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器:
• 解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。
• 解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。
• 事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。
(3)SAM解析的步骤:
//获取SAX解析器工厂类的对象
SAXParserFactoryfactory = SAXParserFactory.newInstance();
//获取Sax解析器
SAXParser sax =factory.newSAXParser();
//通过解析器解析xml文档
//BookHandler事件处理器
sax.parse(new File("src/Book.xml"),newBookHandler());
BookHandler是事件处理器,要想调用必须要重写DefaultHandler中的方法来实现功能,
class BookHandler extendsDefaultHandler{
private boolean flag = false;
@Override
//标签体的内容的解析的方法
public void characters(char[]ch, int start, int length) throws SAXException {
// TODOAuto-generated method stub
super.characters(ch,start, length);
if(flag = true){
System.out.println("元素的内容为:"+new String(ch,start,length));
}
//flag = false;
}
@Override
//文档结束时调用的方法
public void endDocument() throwsSAXException {
// TODOAuto-generated method stub
super.endDocument();
System.out.println("xml文档的结束");
}
@Override
//结束时调用的元素
public void endElement(Stringuri, String locaName, String qName)
throws SAXException {
// TODOAuto-generated method stub
super.endElement(uri,locaName, qName);
//System.out.println("元素的结束:"+qName);
if(qName.equals("书")){
flag = false;
}
}
@Override
public voidstartDocument() throws SAXException {
// TODO Auto-generated method stub
super.startDocument();
System.out.println("xml文档的开始");
}
@Override
public voidstartElement(String uri, String locaName, String qName,
Attributes attributes) throws SAXException {
// TODO Auto-generated method stub
super.startElement(uri,locaName, qName, attributes);
// System.out.println("元素的开启:"+qName);
if(qName.equals("书")){
System.out.println("元素的开启:"+qName);
flag = true;
}
}
}