在我们用DOM模型去解析XML文件,当调用到getChildNodes()方法时会报错。
例如:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
String path = this.getClass().getResource("/testxml/TestDOM/Link.xml").getFile();
File f = new File(path);
Document document = document = builder.parse(f);
Element root = document.getDocumentElement();
NodeList links = root.getChildNodes(); //这里要报错
for(int i =0;i< links.getLength();i++)
{
Element link = (Element) links.item(i);
System.out.println(link.getNodeName());
NodeList elem = link.getChildNodes();
for(int j = 0;j < elem.getLength();j++)
{
System.out.println(elem.item(j).getNodeName());
System.out.println(elem.item(j).getTextContent());
}
}
这是因为XML格式是一个很严谨的格式,解析器解析的时候会把父与子标签之间的缩进空格当成Node节点,所以调用getChildNodes()会出错。
解决方案分为两步:
(1)为XML文件编写一个DTD约束文件。
(2)在实例化工厂后,设置工厂的属性为忽略XML文件标签间的空格。
即:在程序第三行添加 factory.setIgnoringElementContentWhitespace(true);
上述两步缺一不可!