认识XML

XML当今编程世界无处不在,xml文件只是一种数据的载体,不过由于这种数据载体的格式简单易懂,加上良好的扩充性能,使得xml的用处极为广泛。
什么是XML
XML是一种扩展性标识语言,它是一种能够让用户自己创造的语言,可以存储数据和共享数据。
下面是web.xml的XML:

<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://xmlns.jcp.org/xml/ns/javaee"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://xmlns.jcp.org/xml/ns/javaee http://xmlns.jcp.org/xml/ns/javaee/web-app_3_1.xsd"
         version="3.1">
    <servlet>
        <servlet-name>helloServlet</servlet-name>
        <servlet-class>servlet.HelloServlet</servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name>helloServlet</servlet-name>
        <url-pattern>/hello</url-pattern>
    </servlet-mapping>
    <servlet>
        <servlet-name>firstServlet</servlet-name>
        <servlet-class>servlet.FirstServlet</servlet-class>
        <init-param>
            <param-name>message</param-name>
            <param-value>welcome to servlet</param-value>
        </init-param>
        <!--配置为1,tomcat启动时加载该servlet,0,有人第一次请求才加载该servlet-->
        <load-on-startup>1</load-on-startup>
    </servlet>
    <servlet-mapping>
        <servlet-name>firstServlet</servlet-name>
        <url-pattern>/first</url-pattern>
        <url-pattern>/first.jsp</url-pattern>
        <url-pattern>/first.asp</url-pattern>
    </servlet-mapping>
</web-app>

XML的技术架构
数据解析DOM、SAX;样式风格XSTL

XML的基本语法(注意:大小写敏感、空白被保留)
1. 文档的声明

<?xml version="1.0" encoding="UTF-8"?>
  1. xml主体部分
    1)元素:标签之间的内容,元素下可以包含子元素
<servlet>
        <servlet-name>helloServlet</servlet-name>
        <servlet-class>servlet.HelloServlet</servlet-class>
</servlet>

2)属性:xml元素的一部分,定义再xml元素的标签中

<rss version="2.0">
    ...
</rss>

XML解析
要操作xml文档,必先解析xml文档,2种解析方式:DOM和SAX
1.DOM解析
基于对象的API,把XML内容加载生成一个与xml文档内容对应的对象模型。当解析完,内存会生成DOM对象树,然后就根据树的结构,以节点的形式堆文档进行操作

package xml;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;

/**
 * Created by AA on 2017/4/17.
 * DOM解析XML
 */
public class DomDemo {

    public static void main(String[] args) {
        // 创建解析的xml文档对象
        File xmlFile = new File("E:\\study\\java web\\webTest\\src\\xml\\sina.xml");
        // 声明一个 DocumentBuilder对象. 抽象类,不能直接构建,可以通过 DocumentFactory 来构建。
        DocumentBuilder builder = null;
        // 声明一个 DocumentBuilderFactory对象. 通过单例模式创建
        DocumentBuilderFactory builderFactory = DocumentBuilderFactory
                .newInstance();
        // 取得默认的 DocumentBuilder.
        try {
            builder = builderFactory.newDocumentBuilder();
            // 解析文件
            Document document = builder.parse(xmlFile);
            // 获得根元素
            Element root = document.getDocumentElement();
            System.out.println("根元素:" + root.getNodeName());
//             获得根元素下的子节点
            NodeList childNodes = root.getChildNodes();
            // 遍历这些子节点
            for (int i = 0; i < childNodes.getLength(); i++) {
                // 对每个子节点进行判断
                Node node = childNodes.item(i);
                // 如果节点的名称为"article"
                if ("article".equals(node.getNodeName())) {
                    // 输出article元素属性category
                    System.out.println("\r\n 找到一篇文章. 所属分类: "
                            + node.getAttributes().getNamedItem("category")
                            .getNodeValue() + ". ");
                    // 获得<article>元素下的所有节点
                    NodeList nodeDetail = node.getChildNodes();
                    // 遍历<article>元素下的所有节点
                    for (int j = 0; j < nodeDetail.getLength(); j++) {
                        // 获得<article>元素每一个节点
                        Node detail = nodeDetail.item(j);
                        // 根据节点名称解析数据
                        if ("title".equals(detail.getNodeName()))
                            System.out
                                    .println("标题: " + detail.getTextContent());
                        else if ("author".equals(detail.getNodeName()))
                            System.out
                                    .println("作者: " + detail.getTextContent());
                        else if ("email".equals(detail.getNodeName()))
                            System.out.println("电子邮件: "
                                    + detail.getTextContent());
                        else if ("date".equals(detail.getNodeName()))
                            System.out.println("发表日期: "
                                    + detail.getTextContent());
                    }
                }

            }
        } catch (Exception e) {
            e.printStackTrace();
        }

    }
}

解剖代码
通过以上程序可以总结DOM解析XML的流程:
1)首先通过3个步骤创建XML对应的Document对象

DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
        // 取得默认的 DocumentBuilder.
builder = builderFactory.newDocumentBuilder();
Document document = builder.parse(xmlFile);

2)取得Document对象之后通过Document的各种方法遍历XML的内容

注意:XML解析只负责解析正确的XML,对于不合法的XML,会直接抛出解析异常

2.SAX解析
DOM的缺点就是占用内存比较大,速度慢,对于大的XML文件不采取这种方法,针对这种现象,提出了SAX解析

一个简单例子:
SAXDemo

package xml;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

/**
 * Created by AA on 2017/4/18.
 */
public class SaxDemo {
    public static void main(String[] args) {
        File xmlFile = new File("E:\\study\\java web\\webTest\\src\\xml\\sina.xml");

        // 创建一个 SAXParserFactory对象. 通过单例模式创建
        SAXParserFactory factory = SAXParserFactory.newInstance();
        try {
            // 创建SAXParser对象
            SAXParser parser = factory.newSAXParser();
            // 解析文件,并定义解析时的事件处理
            parser.parse(xmlFile, new MySaxHandler());
        } catch (Exception e) {
            e.printStackTrace();
        }

    }
}

MySaxHandler

package xml;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import java.text.DateFormat;
import java.text.SimpleDateFormat;

/**
 * Created by AA on 2017/4/18.
 */
public class MySaxHandler extends DefaultHandler{

    static DateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    private String content;
    private String tag;

    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        if ("item".equals(qName)) {
            System.out.println(qName);
        }
        tag = qName;
    }

    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {

        tag = null;
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        if (tag != null)
        content = new String(ch,start,length);
        if ("title".equals(tag)){
            System.out.println("标题:"+content);
        }
        else if ("link".equals(tag)){
            System.out.println("链接:"+content);
        }
        else if ("author".equals(tag)){
            System.out.println("作者:"+content);
        }
    }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值