XML当今编程世界无处不在,xml文件只是一种数据的载体,不过由于这种数据载体的格式简单易懂,加上良好的扩充性能,使得xml的用处极为广泛。
什么是XML
XML是一种扩展性标识语言,它是一种能够让用户自己创造的语言,可以存储数据和共享数据。
下面是web.xml的XML:
<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://xmlns.jcp.org/xml/ns/javaee"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://xmlns.jcp.org/xml/ns/javaee http://xmlns.jcp.org/xml/ns/javaee/web-app_3_1.xsd"
version="3.1">
<servlet>
<servlet-name>helloServlet</servlet-name>
<servlet-class>servlet.HelloServlet</servlet-class>
</servlet>
<servlet-mapping>
<servlet-name>helloServlet</servlet-name>
<url-pattern>/hello</url-pattern>
</servlet-mapping>
<servlet>
<servlet-name>firstServlet</servlet-name>
<servlet-class>servlet.FirstServlet</servlet-class>
<init-param>
<param-name>message</param-name>
<param-value>welcome to servlet</param-value>
</init-param>
<!--配置为1,tomcat启动时加载该servlet,0,有人第一次请求才加载该servlet-->
<load-on-startup>1</load-on-startup>
</servlet>
<servlet-mapping>
<servlet-name>firstServlet</servlet-name>
<url-pattern>/first</url-pattern>
<url-pattern>/first.jsp</url-pattern>
<url-pattern>/first.asp</url-pattern>
</servlet-mapping>
</web-app>
XML的技术架构
数据解析DOM、SAX;样式风格XSTL
XML的基本语法(注意:大小写敏感、空白被保留)
1. 文档的声明
<?xml version="1.0" encoding="UTF-8"?>
- xml主体部分
1)元素:标签之间的内容,元素下可以包含子元素
<servlet>
<servlet-name>helloServlet</servlet-name>
<servlet-class>servlet.HelloServlet</servlet-class>
</servlet>
2)属性:xml元素的一部分,定义再xml元素的标签中
<rss version="2.0">
...
</rss>
XML解析
要操作xml文档,必先解析xml文档,2种解析方式:DOM和SAX
1.DOM解析
基于对象的API,把XML内容加载生成一个与xml文档内容对应的对象模型。当解析完,内存会生成DOM对象树,然后就根据树的结构,以节点的形式堆文档进行操作
package xml;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;
/**
* Created by AA on 2017/4/17.
* DOM解析XML
*/
public class DomDemo {
public static void main(String[] args) {
// 创建解析的xml文档对象
File xmlFile = new File("E:\\study\\java web\\webTest\\src\\xml\\sina.xml");
// 声明一个 DocumentBuilder对象. 抽象类,不能直接构建,可以通过 DocumentFactory 来构建。
DocumentBuilder builder = null;
// 声明一个 DocumentBuilderFactory对象. 通过单例模式创建
DocumentBuilderFactory builderFactory = DocumentBuilderFactory
.newInstance();
// 取得默认的 DocumentBuilder.
try {
builder = builderFactory.newDocumentBuilder();
// 解析文件
Document document = builder.parse(xmlFile);
// 获得根元素
Element root = document.getDocumentElement();
System.out.println("根元素:" + root.getNodeName());
// 获得根元素下的子节点
NodeList childNodes = root.getChildNodes();
// 遍历这些子节点
for (int i = 0; i < childNodes.getLength(); i++) {
// 对每个子节点进行判断
Node node = childNodes.item(i);
// 如果节点的名称为"article"
if ("article".equals(node.getNodeName())) {
// 输出article元素属性category
System.out.println("\r\n 找到一篇文章. 所属分类: "
+ node.getAttributes().getNamedItem("category")
.getNodeValue() + ". ");
// 获得<article>元素下的所有节点
NodeList nodeDetail = node.getChildNodes();
// 遍历<article>元素下的所有节点
for (int j = 0; j < nodeDetail.getLength(); j++) {
// 获得<article>元素每一个节点
Node detail = nodeDetail.item(j);
// 根据节点名称解析数据
if ("title".equals(detail.getNodeName()))
System.out
.println("标题: " + detail.getTextContent());
else if ("author".equals(detail.getNodeName()))
System.out
.println("作者: " + detail.getTextContent());
else if ("email".equals(detail.getNodeName()))
System.out.println("电子邮件: "
+ detail.getTextContent());
else if ("date".equals(detail.getNodeName()))
System.out.println("发表日期: "
+ detail.getTextContent());
}
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
解剖代码
通过以上程序可以总结DOM解析XML的流程:
1)首先通过3个步骤创建XML对应的Document对象
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
// 取得默认的 DocumentBuilder.
builder = builderFactory.newDocumentBuilder();
Document document = builder.parse(xmlFile);
2)取得Document对象之后通过Document的各种方法遍历XML的内容
注意:XML解析只负责解析正确的XML,对于不合法的XML,会直接抛出解析异常
2.SAX解析
DOM的缺点就是占用内存比较大,速度慢,对于大的XML文件不采取这种方法,针对这种现象,提出了SAX解析
一个简单例子:
SAXDemo
package xml;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
/**
* Created by AA on 2017/4/18.
*/
public class SaxDemo {
public static void main(String[] args) {
File xmlFile = new File("E:\\study\\java web\\webTest\\src\\xml\\sina.xml");
// 创建一个 SAXParserFactory对象. 通过单例模式创建
SAXParserFactory factory = SAXParserFactory.newInstance();
try {
// 创建SAXParser对象
SAXParser parser = factory.newSAXParser();
// 解析文件,并定义解析时的事件处理
parser.parse(xmlFile, new MySaxHandler());
} catch (Exception e) {
e.printStackTrace();
}
}
}
MySaxHandler
package xml;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import java.text.DateFormat;
import java.text.SimpleDateFormat;
/**
* Created by AA on 2017/4/18.
*/
public class MySaxHandler extends DefaultHandler{
static DateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
private String content;
private String tag;
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
if ("item".equals(qName)) {
System.out.println(qName);
}
tag = qName;
}
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
tag = null;
}
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
if (tag != null)
content = new String(ch,start,length);
if ("title".equals(tag)){
System.out.println("标题:"+content);
}
else if ("link".equals(tag)){
System.out.println("链接:"+content);
}
else if ("author".equals(tag)){
System.out.println("作者:"+content);
}
}
}