英语渣渣学Java的day11

6 篇文章 0 订阅
2 篇文章 0 订阅
这篇博客介绍了XML的基本概念,包括属性、文本和特殊字符的处理,以及XML的解析技术,强调了DOM4J在Java中解析XML的优越性和易用性。详细讲述了DOM4J解析XML的步骤,并指出在实际项目中DOM4J的广泛应用。
摘要由CSDN通过智能技术生成

xml介绍

xml语言,可扩展的标记语言,这门语言它没有定义任何的标记,而标记是由使用者自己来定义,但是由于标签名称以及属性名称都由用户自己来命名,导致别人在使用的时候很不方便。又给xml语言定义了一些约束文档,这些约束文档就专门用来约束当前这个xml中能够书写的具体的标签以及属性等信息。

属性

在定义标签的时候,可以在标签上书写属性,属性是由key和alue值组成。属性名书写的时候也遵守标签名的规则。属性值也不能以数字开始。
属性和值之间使用=连接,属性值可以使用单引号也可以使用双引号。

文本和特殊字符

在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理。
遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直接原封不动的输出。.

语法:<![CDATA[ 内容 ]]>

    <![CDATA[
        <gec>
            <br/>
        </gec>
    ]]>

对于一些单个字符,若想显示其原始样式,也可以使用转义的形式予以处理。

特殊字符

在XML中,有些字符如& 、<、 >、 "等代表了特定语法作用,如果要拿这些字符当作字符串内容,需要进行转义,否则XML解析会出错。这些转义的符号也叫实体引用

img

特殊指令

处理指令,简称PI (processing instruction)。处理指令用来指挥解析引擎如何解析XML文档内容。
处理指令必须以<?作为开头,以?>作为结尾,XML声明语句就是最常见的一种处理指令。

xml语法规则总结

所有xml元素必须有闭合标签;
Xml标签区分大小写;
Xml必须正确地嵌套顺序;
Xml文档必须有根元素(且只有一个);
Xml属性值须加引号 特殊字符必须转义——CDATA;
Xml中的空格、回车换行会被解析!

Java中的解析技术介绍

XML的解析方式分为四种:

DOM解析
SAX解析
JDOM解析
DOM4J解析

其中前两种属于基础方法,是官方提供的平台无关的解析方式,后两种属于扩展方法,它们是在基础的方法上扩展出来的,只适用于java平台。

DOM解析xml

	 @Test
    public void get() throws Exception {
        // 获取工厂实例对象
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        // 获取解析器对象
        DocumentBuilder db = dbf.newDocumentBuilder();
        // 解析xml获取dom对象
        Document dom = db.parse("src/books.xml");
        // 获取根元素:
        Node node = dom.getFirstChild();
        // 获取标签的名字
        System.out.println(node.getNodeName());//books
        // 获取到每个标签对象,都是一个element的实例对象
        Element root = (Element) node;
        // 获取books下面的所有book标签
        NodeList nl = root.getElementsByTagName("book");
        for (int i = 0; i < nl.getLength(); i++) {
            // 获取到每个book标签对象
            Element book = (Element) nl.item(i);
            // NodeList book_child = book.getChildNodes();
            //根据名字找到标签  <title>西游记</title>
            Element title = (Element) book.getElementsByTagName("title").item(0);
            Element author = (Element) book.getElementsByTagName("author").item(0);
            Element price = (Element) book.getElementsByTagName("price").item(0);
            // 获取name标签下的文本值
            System.out.println(title.getTextContent());
            // 获取标签上的属性值
            System.out.println(title.getAttribute("id"));
            // 获取author标签下的文本值
            System.out.println(author.getTextContent());
            // 获取price标签下的文本值
            System.out.println(price.getTextContent());
            System.out.println("-------------------");

        }
    }

SAX解析

	 @Test
     public void read() throws Exception{
         //获取工厂
         XMLInputFactory factory = XMLInputFactory.newFactory();
         //获取解析器
         XMLEventReader reader = factory.createXMLEventReader(new FileInputStream("src/books.xml"));
         //使用循环开始读取数据
         while( reader.hasNext() ){
             XMLEvent event = reader.nextEvent();
             if(event.isStartElement()){// <
                 //获取当前这个标签
                 StartElement element = event.asStartElement();
                 //获取标签上的 id属性
                 Attribute attr = element.getAttributeByName(new QName("id"));
                 if( attr != null ){
                     System.out.println("id="+attr.getValue());
                 }
                 //判断当前的标签名是否是name或者author、price
                 if( element.getName().getLocalPart().equals("title") ){
                     XMLEvent text = reader.nextEvent();
                     System.out.println(text.asCharacters());
                 }else if( element.getName().getLocalPart().equals("author") ){
                     XMLEvent text = reader.nextEvent();
                     System.out.println(text.asCharacters());
                 }else if( element.getName().getLocalPart().equals("price") ){
                     XMLEvent text = reader.nextEvent();
                     System.out.println(text.asCharacters());
                 }
                 
             }
             
         }
     }

DOM4J解析

与利用DOM、SAX来解析xml相比,DOM4J 表现更优秀,具有性能优异、功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。dom4j是一套开源的api。实际项目中,往往选择dom4j来解析xml。如java有名的Hibernate等框架都使用到了dom4及解析。

步骤

1 在项目中加入dom4j.jar,加入类路径
2 读取src下的note.xml ,用inputStream
3 创建SaxReader对象 ,解析对象
4 调用read()返回一个文档Document
5 获得根元素 ,调用方法getRootElement
6 获取子元素 to元素
7 getText返回文本节点,打印内容

package com.gec.xml;

import java.io.InputStream;

import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
import org.junit.Test;

public class TestReadNote2 {
	
	@Test
	public void read() {
		/*
		 * 1 在项目中加入dom4j.jar,加入类路径 
		 * 2 读取src下的note.xml ,用inputStream
		 * 3 创建SaxReader对象 ,解析对象
		 * 4 调用read()返回一个文档Document
		 * 5 获得根元素 ,调用方法getRootElement
		 * 6 获取子元素 to元素
		 *    7 getText返回文本节点,打印内容
		 */
		try(InputStream is = TestReadNote2.class.getResourceAsStream("/note.xml")){
			// 创建SaxReader对象 ,解析对象
			SAXReader reader = new SAXReader();
			// 调用read()返回一个文档Document
			Document doc = reader.read(is);
			//获得根元素 ,调用方法getRootElement
			Element rootElement = doc.getRootElement();
			// 获取子元素 to元素 <to>林志玲</to>
			Element to = rootElement.element("to");
			//getText返回文本节点,打印内容
			String toContent = to.getText();
			System.out.println(to.getName() + ":" + toContent);
			
			//from
			Element from = rootElement.element("from");
			System.out.println(from.getName() + ":" + from.getText());
			
			//title
			String title = rootElement.element("title").getText();
			System.out.println(title);
			
			//简化
			System.out.println(rootElement.elementText("heading"));
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

注意:DOM和SAX解析不太常用了解就好,但是DOM4J解析比较常用必须掌握。

相关内容介绍
https://github.com/laity985/laity985

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沉莫的羔羊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值