Vscode学习XML约束和解析

最新推荐文章于 2024-05-29 09:33:47 发布

君_莫_笑

最新推荐文章于 2024-05-29 09:33:47 发布

阅读量1.4k

点赞数 2

分类专栏： java学习笔记文章标签：前端 java javascript

本文链接：https://blog.csdn.net/qq_41323408/article/details/130351432

版权

java学习笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

XML(eXtensible Markup Language)可扩展标记语言

XML 被设计用来传输和存储数据。HTML 被设计用来显示数据。

XML用途

XML 应用于 Web 开发的许多方面，常用于简化数据的存储和共享。

XML树结构

<?xml version="1.0" encoding="UTF-8"?>  <!---声明--->
<note>                                  <!---根标签--->
	<to>Tove</to>						<!---节点--->
	<from>Jani</from>
	<heading>Reminder</heading>
	<body>Don't forget me this weekend!</body>
</note>

XML标签书写规则

合法的标签名
名称可以包含字母、数字以及其他的字符
名称不能以数字或者标点符号开始
名称不能以字母 xml（或者 XML、Xml 等等）开始
名称不能包含空格
合理使用属性

<shop-cart>
<!---属性设置, sn代表编号,category代表类别-->
	<item sn = "771938" category = "电器">   
		<name>XX空调</name>
		<price>2000.00</price>
	</item>
</shop-cart>

有序的子元素
适当的注释和缩进
特殊字符与CDATA标签
不要使用<这种标签体本身含有的特殊符号，与程序代码的关键字

<!---无效的XML--->
<exam>
	<question> 1 + 4 < 3是否正确？</question>
	<question> 3 + 5 > 8是否正确？</question>
</exam>

使用实体引用(类似于转义字符)

<exam>
	<question> 1 + 4 &lt; 3是否正确？</question>
	<question> 3 + 5 &gt; 8是否正确？</question>
</exam>

使用CDATA
在该区域中的数据会被原样展示

<exam>
	<question> <![CDATA[1 + 4 < 3是否正确?]]> </question>
	<question> <![CDATA[3 + 5 > 8是否正确?]]> </question>
</exam>

约束：规定xml文档的书写规则

1. DTD:一种简单的约束技术

内部dtd	将约束规则定义在xml文档中
外部dtd	将约束的规则定义在外部的dtd文件中

本地：<!DOCTYPE 根标签名 SYSTEM "dtd文件的位置">
网络：<!DOCTYPE 根标签名 PUBLIC "dtd文件名字" "dtd文件的位置URL">

DTD约束代码显示：

<!ELEMENT students (student*) >   <!---students标签有0个或者多个student标签--->
<!ELEMENT student (name,age,sex)> <!---student标签有name age sex标签--->
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT sex (#PCDATA)>
<!ATTLIST student number ID #REQUIRED>  <!---student必须有一个number属性值--->

使用代码说明

<?xml version='1.0' encoding="UTF-8"?>
<!DOCTYPE students SYSTEM "../constrains/student.dtd">
<students>
    <student number="s001">
        <name>***</name>
        <age>***</age>
        <sex>female</sex>
    </student>
</students>

DTD无法针对标签的内容严格限制,因此推荐使用更复杂的Schema

2. Schema:一种复杂的约束技术
引入：
1.填写xml文档的根元素
2.引入xsi前缀. xmlns:xsi=“http://www.w3.org/2001/XMLSchema-instance”，这里不唯一，看具体的使用
3.引入xsd文件命名空间. xsi:schemaLocation=“xsd对应的别名 xsd文件路径” ，一般这个别名已经在约束文件中写好了的
4.为每一个xsd约束声明一个默认前缀,作为标识 xmlns=“建议写别名”

约束代码

<?xml version="1.0"?>
<xsd:schema xmlns="stu_xsd"
        xmlns:xsd="http://www.w3.org/2001/XMLSchema"
        targetNamespace="stu_xsd" elementFormDefault="qualified">
    <xsd:element name="students" type="studentsType"/>
    <!-- 声明了一个studentstype类型 -->
    <xsd:complexType name="studentsType">
        <!-- 按顺序出现 -->
        <xsd:sequence>
            <!-- 元素名字为student，对应的最少出现0次，最多不做限定 -->
            <xsd:element name="student" type="studentType" minOccurs="0" maxOccurs="unbounded"/>
        </xsd:sequence>
    </xsd:complexType>
    
    <xsd:complexType name="studentType">
        <xsd:sequence>
            <xsd:element name="name" type="xsd:string"/>
            <xsd:element name="age" type="ageType" />
            <xsd:element name="sex" type="sexType" />
        </xsd:sequence>
        <!-- 属性是number，必须拥有 -->
        <xsd:attribute name="number" type="numberType" use="required"/>
    </xsd:complexType>
    
    <xsd:simpleType name="sexType">
        <xsd:restriction base="xsd:string">
            <xsd:enumeration value="male"/>
            <xsd:enumeration value="female"/>
        </xsd:restriction>
    </xsd:simpleType>

    <xsd:simpleType name="ageType">
        <xsd:restriction base="xsd:integer">
            <xsd:minInclusive value="0"/>
            <xsd:maxInclusive value="256"/>
        </xsd:restriction>
    </xsd:simpleType>

    <xsd:simpleType name="numberType">
        <xsd:restriction base="xsd:string">
            <xsd:pattern value="heima_\d{4}"/>
        </xsd:restriction>
    </xsd:simpleType>
    
</xsd:schema>

使用说明：

<?xml version='1.0' encoding="UTF-8"?>
<students   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
            xsi:schemaLocation="stu_xsd ../constrains/student.xsd"
            xmlns="stu_xsd">
            <student number="heima_1234">
                <name>***</name>
                <age>23</age>
                <sex>female</sex>
            </student>
</students>

解析

操作xml文档，将文档中的数据读取到内存中

 	1. 解析(读取)：将文档中的数据读取到内存中
 	2. 写入：将内存中的数据保存到xml文档中。持久化的存储

解析xml的方式：

 	1. DOM：将标记语言文档一次性加载进内存，在内存中形成一颗dom树
 		* 优点：操作方便，可以对文档进行CRUD的所有操作
 		* 缺点：占内存
 	2. SAX：逐行读取，基于事件驱动的。
 		* 优点：不占内存。
 		* 缺点：只能读取，不能增删改

3.解析器

 	1. JAXP：sun公司提供的解析器，支持dom和sax两种思想
 	2. DOM4J：一款非常优秀的解析器
 	3. Jsoup：jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。
 	4. PULL：Android操作系统内置的解析器，sax方式的。

Jsoup使用

下载并导入
获取Document对象
获取对应标签对象
获取数据

对象
Jsoup：工具类，可以解析html或xml文档，返回Document

Jsoup	parse(File in, String charsetName)	解析xml或html文件的
	parse(String html)	解析xml或html字符串
	parse(URL url, int timeoutMillis)	通过网络路径获取指定的html或xml的文档对象

Document：文档对象。代表内存中的dom树

Document	getElementById(String id)	根据id属性值获取唯一的element对象
	getElementsByTag(String tagName)	根据标签名称获取元素对象集合
	getElementsByAttribute(String key)	根据属性名称获取元素对象集合
	getElementsByAttributeValue(String key, String value)	根据对应的属性名和属性值获取元素对象集合

Elements：元素Element对象的集合。可以当做 ArrayList来使用
Element：元素对象，方法与Document对象完全一致，区别是获取的是子元素对象
Node：节点对象，是Document和Element的父类

定位标签内容

逐步搜索：根据document获取所有的student对应的Elements对象，选择其中的某个element对象，使用方法得到对应的name属性或者age属性等
快速选择

selector:选择器
* 使用的方法：Elements select(String cssQuery) cssQuery参考文档
* 语法：参考Selector类中定义的语法
* 示例代码

<?xml version='1.0' encoding="UTF-8"?>
<students>
    <student number="heima_1234">
        <name id="csuStu">Jack</name>
        <age>18</age>
        <sex>male</sex>
    </student>
    <student number="heima_1235">
        <name>Tom</name>
        <age>23</age>
        <sex>female</sex>
    </student>
</students>

package XML;

import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.File;


import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;

public class JsoupDemo2 {
    public static void main(String[] args){
        String path = JsoupDemo2.class.getClassLoader().getResource("users.xml").getPath();
        try{
            Document doc = Jsoup.parse(new File(path), "utf-8");
            Elements elesName = doc.select("name");
            Elements elesId = doc.select("#csuStu");//得到id值
            System.out.println(elesName);
            System.out.println("-------------------");
            Elements elesStu = doc.select("student[number='heima_1234'] > age");
            System.out.println(elesStu);
        }catch(FileNotFoundException e){
            e.printStackTrace();
        }catch(IOException e2){
            e2.printStackTrace();
        }catch(NullPointerException e3){
            e3.printStackTrace();
        }
    }
}

XPath：XPath即为XML路径语言，它是一种用来确定XML（标准通用标记语言的子集）文档中某部分位置的语言
* 使用Jsoup的Xpath需要额外导入jar包。
* 查询l参考手册菜鸟教程Xpath手册，使用xpath的语法完成查询

下载拖到vscode项目下的lib文件夹内 Xpath包
仍然采用上面XML文件，对应Xpath代码访问为：

package XML;

import org.jsoup.nodes.Document;

import cn.wanghaomiao.xpath.exception.XpathSyntaxErrorException;
import cn.wanghaomiao.xpath.model.JXDocument;
import cn.wanghaomiao.xpath.model.JXNode;

import java.io.File;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.List;
import org.jsoup.Jsoup;

public class JsoupDemoXpath {
    public static void main(String[] args){
        String path = JsoupDemoXpath.class.getClassLoader().getResource("users.xml").getPath();
        try{
            Document doc = Jsoup.parse(new File(path), "utf-8");
            JXDocument jxDocument = new JXDocument(doc);
            List<JXNode> JXNodes= jxDocument.selN("//student/name[@id=csuStu]");
            System.out.println(JXNodes);
        }catch(FileNotFoundException e){
            e.printStackTrace();
        }catch(IOException e2){
            e2.printStackTrace();
        }catch(XpathSyntaxErrorException e3){
            e3.printStackTrace();
        }
    }
}

君_莫_笑

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
Vscode学习XML约束和解析

根据document获取所有的student对应的Elements对象，选择其中的某个element对象，使用方法得到对应的name属性或者age属性等。3.引入xsd文件命名空间. xsi:schemaLocation=“xsd对应的别名 xsd文件路径” ，一般这个别名已经在约束文件中写好了的。Element：元素对象，方法与Document对象完全一致，区别是获取的是子元素对象。XML 应用于 Web 开发的许多方面，常用于简化数据的存储和共享。操作xml文档，将文档中的数据读取到内存中。
复制链接

扫一扫