XML是一种可扩展的标记语言,首先它是一种标记语言,类似于HTML,有标签,标签有属性,然而与HTML不同的是XML的标签是可以自己定义的,这样就方便我们存储一些有层次结构的内容!
这里要说的是使用DOM去解析XML文件:
首先,DOM是一种文档对象模型(Document Object Model),使用DOM解析时会将XML文档表示为树状,具有层次性。
如下是一个xml文件的例子:
<?xml version="1.0" encoding="UTF-8"?>
<person>
<teacher id="1">
<name>小白</name>
<desc>小白人</desc>
</teacher>
<teacher id="2">
<name>小黑</name>
<desc>小黑人</desc>
</teacher>
</person>
第一行为xml文件声明的头,包括版本号和字符编码
接下来是实体内容,<person>是自定义的标签,里面包含两个teacher标签,id是标签的属性,标签内部可以嵌套使用标签,成为子标签
对一个XML文件解析通常有以下几个步骤:
//首先创建Dom解析器工厂
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//通过解析器工厂创建解析器
DocumentBuilder builder = dbf.newDocumentBuilder();
//创建Document对象开始解析,is为xml文件输入流,解析的过程就如同形成一棵树的过程
Document doc = builder.parse(is);
//根据文档的节点返回NodeList列表
NodeList nodelist = doc.getElementsByTagName("teacher");
下面是一个例子,通过一个XML文件中的数据创建Teacher对象,Teacher类的定义如下:
package xml;
/**
* Created by zhuxinquan on 16-1-20.
*/
public class Teacher {
private int id;
private String name;
private String desc;
@Override
public String toString() {
return "Teacher{" +
"id=" + id +
", name='" + name + '\'' +
", desc='" + desc + '\'' +
'}';
}
public Teacher() {
}
public Teacher(int id, String name, String desc) {
this.id = id;
this.name = name;
this.desc = desc;
}
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getDesc() {
return desc;
}
public void setDesc(String desc) {
this.desc = desc;
}
}
下面是解析使用的DomParseDemo类:
package xml;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;
/**
* Created by zhuxinquan on 16-1-20.
*/
public class DomParseDemo {
/**
* 一个解析类对应一个xml文件
* @throws IOException
* @throws ParserConfigurationException
* @throws SAXException
*/
public static void main(String[] args) throws IOException, ParserConfigurationException, SAXException {
//创建Dom解析器工厂
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//通过解析器工厂创建解析器
DocumentBuilder builder = dbf.newDocumentBuilder();
//构造一个输入流
InputStream is = new FileInputStream("teacher.xml");
//开始解析,创建Document对象
Document doc = builder.parse(is);
//存储Teacher的集合
List<Teacher> teachers = new ArrayList<Teacher>();
Teacher t = null;
//根据文档的结点获取数据,返回一个NodeList列表
NodeList nodelist = doc.getElementsByTagName("teacher");
for (int i = 0; i < nodelist.getLength(); i++) {
t = new Teacher();
//item返回值为一个结点,返回一个Node对象
Node teachernode = nodelist.item(i);
//getAttributes取得当前结点下的所有属性,getNameItem根据属性名称获取当前属性
String id = teachernode.getAttributes().getNamedItem("id").getNodeValue();
// System.out.println(id);
t.setId(Integer.parseInt(id));
//获取当前节点下的所有子节点列表
NodeList childNodeList = teachernode.getChildNodes();
for (int j = 0; j < childNodeList.getLength(); j++) {
//获取teacher节点下的其中一个子节点
Node childNode = childNodeList.item(j);
String tagName = childNode.getNodeName();
if("name".equals(tagName)){
//获取teacher节点下的name节点的值
t.setName(childNode.getFirstChild().getNodeValue());
}else if("desc".equals(tagName)){
//获取teacher节点下的desc值
t.setDesc(childNode.getFirstChild().getNodeValue());
}else{
System.out.println(childNode.getFirstChild().getNodeValue());
}
}
teachers.add(t);
}
System.out.println(teachers);
}
}
以上是一个比较简单的通过Dom去解析xml文件的例子,对于不同的xml文件需要定义不同的解析器,对于解析xml文件实质就是通过不同的标签获取到不同的内容,对应于最深层子标签中的内容是通过子标签getNodeValue获取的,也就是说,任何标签内的子标签是被当做上层标签的内容一块获取的。
!!初次学习,错误之处还望指正~~~