认识XML

最新推荐文章于 2024-10-09 15:12:06 发布

婵婵子~

最新推荐文章于 2024-10-09 15:12:06 发布

阅读量344

点赞数 1

分类专栏： java-web 文章标签： xml

本文链接：https://blog.csdn.net/ldczzzzzz/article/details/70213992

版权

java-web 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

XML当今编程世界无处不在，xml文件只是一种数据的载体，不过由于这种数据载体的格式简单易懂，加上良好的扩充性能，使得xml的用处极为广泛。
什么是XML
XML是一种扩展性标识语言，它是一种能够让用户自己创造的语言，可以存储数据和共享数据。
下面是web.xml的XML：

<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns="http://xmlns.jcp.org/xml/ns/javaee"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://xmlns.jcp.org/xml/ns/javaee http://xmlns.jcp.org/xml/ns/javaee/web-app_3_1.xsd"
         version="3.1">
    <servlet>
        <servlet-name>helloServlet</servlet-name>
        <servlet-class>servlet.HelloServlet</servlet-class>
    </servlet>
    <servlet-mapping>
        <servlet-name>helloServlet</servlet-name>
        <url-pattern>/hello</url-pattern>
    </servlet-mapping>
    <servlet>
        <servlet-name>firstServlet</servlet-name>
        <servlet-class>servlet.FirstServlet</servlet-class>
        <init-param>
            <param-name>message</param-name>
            <param-value>welcome to servlet</param-value>
        </init-param>
        <!--配置为1，tomcat启动时加载该servlet，0，有人第一次请求才加载该servlet-->
        <load-on-startup>1</load-on-startup>
    </servlet>
    <servlet-mapping>
        <servlet-name>firstServlet</servlet-name>
        <url-pattern>/first</url-pattern>
        <url-pattern>/first.jsp</url-pattern>
        <url-pattern>/first.asp</url-pattern>
    </servlet-mapping>
</web-app>

XML的技术架构
数据解析DOM、SAX；样式风格XSTL

XML的基本语法(注意：大小写敏感、空白被保留)
1. 文档的声明

<?xml version="1.0" encoding="UTF-8"?>

xml主体部分
1）元素：标签之间的内容，元素下可以包含子元素

<servlet>
        <servlet-name>helloServlet</servlet-name>
        <servlet-class>servlet.HelloServlet</servlet-class>
</servlet>

2）属性：xml元素的一部分，定义再xml元素的标签中

<rss version="2.0">
    ...
</rss>

XML解析
要操作xml文档，必先解析xml文档，2种解析方式：DOM和SAX
1.DOM解析
基于对象的API,把XML内容加载生成一个与xml文档内容对应的对象模型。当解析完，内存会生成DOM对象树，然后就根据树的结构，以节点的形式堆文档进行操作

package xml;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.File;

/**
 * Created by AA on 2017/4/17.
 * DOM解析XML
 */
public class DomDemo {

    public static void main(String[] args) {
        // 创建解析的xml文档对象
        File xmlFile = new File("E:\\study\\java web\\webTest\\src\\xml\\sina.xml");
        // 声明一个 DocumentBuilder对象. 抽象类，不能直接构建，可以通过 DocumentFactory 来构建。
        DocumentBuilder builder = null;
        // 声明一个 DocumentBuilderFactory对象. 通过单例模式创建
        DocumentBuilderFactory builderFactory = DocumentBuilderFactory
                .newInstance();
        // 取得默认的 DocumentBuilder.
        try {
            builder = builderFactory.newDocumentBuilder();
            // 解析文件
            Document document = builder.parse(xmlFile);
            // 获得根元素
            Element root = document.getDocumentElement();
            System.out.println("根元素：" + root.getNodeName());
//             获得根元素下的子节点
            NodeList childNodes = root.getChildNodes();
            // 遍历这些子节点
            for (int i = 0; i < childNodes.getLength(); i++) {
                // 对每个子节点进行判断
                Node node = childNodes.item(i);
                // 如果节点的名称为"article"
                if ("article".equals(node.getNodeName())) {
                    // 输出article元素属性category
                    System.out.println("\r\n 找到一篇文章. 所属分类: "
                            + node.getAttributes().getNamedItem("category")
                            .getNodeValue() + ". ");
                    // 获得<article>元素下的所有节点
                    NodeList nodeDetail = node.getChildNodes();
                    // 遍历<article>元素下的所有节点
                    for (int j = 0; j < nodeDetail.getLength(); j++) {
                        // 获得<article>元素每一个节点
                        Node detail = nodeDetail.item(j);
                        // 根据节点名称解析数据
                        if ("title".equals(detail.getNodeName()))
                            System.out
                                    .println("标题: " + detail.getTextContent());
                        else if ("author".equals(detail.getNodeName()))
                            System.out
                                    .println("作者: " + detail.getTextContent());
                        else if ("email".equals(detail.getNodeName()))
                            System.out.println("电子邮件: "
                                    + detail.getTextContent());
                        else if ("date".equals(detail.getNodeName()))
                            System.out.println("发表日期: "
                                    + detail.getTextContent());
                    }
                }

            }
        } catch (Exception e) {
            e.printStackTrace();
        }

    }
}

解剖代码
通过以上程序可以总结DOM解析XML的流程：
1）首先通过3个步骤创建XML对应的Document对象

DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
        // 取得默认的 DocumentBuilder.
builder = builderFactory.newDocumentBuilder();
Document document = builder.parse(xmlFile);

2）取得Document对象之后通过Document的各种方法遍历XML的内容

注意：XML解析只负责解析正确的XML,对于不合法的XML，会直接抛出解析异常

2.SAX解析
DOM的缺点就是占用内存比较大，速度慢，对于大的XML文件不采取这种方法，针对这种现象，提出了SAX解析

一个简单例子：
SAXDemo

package xml;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

/**
 * Created by AA on 2017/4/18.
 */
public class SaxDemo {
    public static void main(String[] args) {
        File xmlFile = new File("E:\\study\\java web\\webTest\\src\\xml\\sina.xml");

        // 创建一个 SAXParserFactory对象. 通过单例模式创建
        SAXParserFactory factory = SAXParserFactory.newInstance();
        try {
            // 创建SAXParser对象
            SAXParser parser = factory.newSAXParser();
            // 解析文件,并定义解析时的事件处理
            parser.parse(xmlFile, new MySaxHandler());
        } catch (Exception e) {
            e.printStackTrace();
        }

    }
}

MySaxHandler

package xml;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import java.text.DateFormat;
import java.text.SimpleDateFormat;

/**
 * Created by AA on 2017/4/18.
 */
public class MySaxHandler extends DefaultHandler{

    static DateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

    private String content;
    private String tag;

    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        if ("item".equals(qName)) {
            System.out.println(qName);
        }
        tag = qName;
    }

    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {

        tag = null;
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
        if (tag != null)
        content = new String(ch,start,length);
        if ("title".equals(tag)){
            System.out.println("标题："+content);
        }
        else if ("link".equals(tag)){
            System.out.println("链接："+content);
        }
        else if ("author".equals(tag)){
            System.out.println("作者："+content);
        }
    }
}