一、用DOM方式解析XML
此例子节点结构如下:
1、获取book节点属性
(1).如果不知道节点的属性,通过 NamedNodeMap attrs = book.getAttributes(); 来获取属性的集合(蓝色部分代码)
(2)、如果知道book节点有且只有一个id属性,则用
Element book = (Element)bookList.item(i);
String attrValue = book.getAttribute("id");
来遍历属性,将蓝色部分替换为黄色部分
import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.NodeList; import org.xml.sax.SAXException; public class DomTest { public static void main(String[] args) { //1.创建一个DocumentBuilderFactory对象 DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance(); //2.创建一个DocumentBuilder对象 try { //3.创建一个Document对象 DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder(); //4.通过Document对象的perse方法加载book。xml文件到当前项目下 Document document = documentBuilder.parse("book.xml"); //获取book结点的集合 NodeList bookList = document.getElementsByTagName("book"); //遍历每一个book节点 //获取bookLength()长度 System.out.println("共有" + bookList.getLength() + "本书"); for(int i = 0;i < bookList.getLength();i++) { System.out.println("现在开始遍历第" + (i + 1) + "本书---"); //通过item(i)获取book节点,下标从0开始 Node book = bookList.item(i); //获取book属性集合 NamedNodeMap attrs = book.getAttributes(); //遍历book属性 System.out.println("第" + (i + 1) + "本书共有" + attrs.getLength()+ "个属性"); for(int j = 0;j < attrs.getLength();j++) { //通过item()获取属性 Node attr = attrs.item(j); System.out.print("属性名" + attr.getNodeName()); System.out.println(" 属性值" + attr.getNodeValue()); }
Element book = (Element)bookList.item(i); String attrValue = book.getAttribute("id"); System.out.println(attrValue);
System.out.println("第" + (i + 1) + "本书遍历完毕"); } } catch (ParserConfigurationException e) { e.printStackTrace(); } catch (SAXException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } }
3、遍历book的子节点的属性
(1)、用 NodeList childNodes = book.getChildNodes(); 来获取子节点的属性
(2)、用 getValue()不能得到子节点值, 因为Element类型getValue()返回null
(3)、用 childNodes.item(k).getFirstChild().getNodeValue() 可以得不到子节点的值(蓝色部分)
(4)、用 childNodes.item(k).getTextContent() 可以得到子节点的值(黄色部分)
public class DomTest { public static void main(String[] args) { //1.创建一个DocumentBuilderFactory对象 DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance(); //2.创建一个DocumentBuilder对象 try { //3.创建一个Document对象 DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder(); //4.通过Document对象的perse方法加载book。xml文件到当前项目下 Document document = documentBuilder.parse("book.xml"); //获取book结点的集合 NodeList bookList = document.getElementsByTagName("book"); //遍历每一个book节点 //获取bookLength()长度 System.out.println("共有" + bookList.getLength() + "本书"); for(int i = 0;i < bookList.getLength();i++) { System.out.println("------------现在开始遍历第" + (i + 1) + "本书---------"); //通过item(i)获取book节点,下标从0开始 Node book = bookList.item(i); //获取book属性集合 NamedNodeMap attrs = book.getAttributes(); //遍历book属性 System.out.println("第" + (i + 1) + "本书共有" + attrs.getLength()+ "个属性"); for(int j = 0;j < attrs.getLength();j++) { //通过item()获取属性 Node attr = attrs.item(j); System.out.print("属性名" + attr.getNodeName()); System.out.println(" 属性值" + attr.getNodeValue()); } NodeList childNodes = book.getChildNodes(); //遍历childNodes获取节点名和结点值 System.out.println("第" + (i + 1) + "本书共有" + childNodes.getLength() + "个子节点"); for(int k = 0;k < childNodes.getLength();k++) { //区分text类型的Node和Element类型的Node if(childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) { //获取Element节点名和节点名 System.out.print("第" + (k + 1) + "个节点的节点名是" + childNodes.item(k).getNodeName());
System.out.println("----节点的节点值是" + childNodes.item(k).getFirstChild().getNodeValue());
System.out.println("----节点的节点值是" + childNodes.item(k).getTextContent()); } } System.out.println("------------第" + (i + 1) + "本书遍历完毕-------------"); } } catch (ParserConfigurationException e) { e.printStackTrace(); } catch (SAXException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } }
(5)、如果节点变成这样
加上一个节点,childNodes.item(k).getFirstChild().getNodeValue() 返回的是null,不是节点值,此时getFirstChild为<aaa>节点,Element类型。
而 childNodes.item(k).getTextContent() 返回的正常的子节点值
小白一枚,还有不懂得地方:加上<aaa>节点之后getFirstChild().getNodeValue() 为什么返回不了“ADD”呢?
欢迎批评指正,谢谢。