day12_xml

最新推荐文章于 2020-11-03 10:26:14 发布

0x745e

最新推荐文章于 2020-11-03 10:26:14 发布

阅读量171

点赞数

分类专栏： javaweb

本文链接：https://blog.csdn.net/weixin_42651836/article/details/81835712

版权

javaweb 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

今日内容

XML
- 概念
- 语法
- 解析

XML

可扩展：标签都是自定义的。 <user> <student>
功能:存储数据
- 配置文件
- 在网络中传输
xml与html的区别

xml标签都是自定义的，html标签是预定义。
xml的语法严格，html语法松散
xml是存储数据的，html是展示数据

w3c:万维网联盟

XML 语法

基本语法

xml文档的后缀名 .xml
xml第一行必须定义为文档声明
xml文档中有且仅有一个根标签
属性值必须使用引号(单双都可)引起来
标签必须正确关闭
xml标签名称区分大小写

快速入门

<?xml version='1.0' ?>
<users>
	<user id='1'>
		<name>zhangsan</name>
		<age>23</age>
		<gender>male</gender>
		<br/>
	</user>
	
	<user id='2'>
		<name>lisi</name>
		<age>24</age>
		<gender>female</gender>
	</user>
</users>

组成部分

文档声明

格式：<?xml 属性列表 ?>
属性列表：
- version：版本号，必须的属性
- encoding：编码方式。告知解析引擎当前文档使用的字符集，默认值：ISO-8859-1
- ~~standalone：是否独立~~
  - 取值：
    - yes：不依赖其他文件
    - no：依赖其他文件

指令(了解)：结合css的

~~<?xml-stylesheet type="text/css" href="a.css" ?>~~

标签：标签名称自定义的

规则：
- 名称可以包含字母、数字以及其他的字符
- 名称不能以数字或者标点符号开始
- 名称不能以字母 xml（或者 XML、Xml 等等）开始
- 名称不能包含空格

属性：

id属性值唯一

文本：

CDATA区：在该区域中的数据会被原样展示
- 格式： <![CDATA[ 数据 ]]>

XLM约束

规定xml文档的书写规则

作为框架的使用者(程序员)：
1. 能够在xml中引入约束文档
2. 能够简单的读懂约束文档

DTD

引入dtd文档到xml文档中

内部dtd：将约束规则定义在xml文档中
外部dtd：将约束的规则定义在外部的dtd文件中
- 本地：<!DOCTYPE 根标签名 SYSTEM "dtd文件的位置">
- 网络：<!DOCTYPE 根标签名 PUBLIC "dtd文件名字" "dtd文件的位置URL">

Schema

约束的范围比DTD要广泛
创建Schema
- 定义后缀名为xsd文件
- 模板代码

<xsd:schema
    xmlns:xsd="http://www.w3.org/2001/XMLSchema"
    targetNamespace="http://www.itheima.com/xml"
    xmlns="http://www.itheima.com/xml"
    elementFormDefault="qualified">
</xsd:schema>

编写约束

引入写好的Schema

模板代码 :

<students   
	xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	xmlns="http://www.itheima.com/xml"
	xsi:schemaLocation="http://www.itheima.com/xml  student.xsd"
></students>

XML解析

操作xml文档

解析(读取)：将文档中的数据读取到内存中
写入：将内存中的数据保存到xml文档中。持久化的存储

解析xml的方式：

DOM：将标记语言文档一次性加载进内存，在内存中形成一颗dom树
- 优点：操作方便，可以对文档进行CRUD的所有操作
- 缺点：占内存
SAX：逐行读取，基于事件驱动的。
- 优点：不占内存。
- 缺点：只能读取，不能增删改

xml常见的解析器：

JAXP：sun公司提供的解析器，支持dom和sax两种思想
DOM4J：一款非常优秀的解析器
Jsoup：jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。
PULL：Android操作系统内置的解析器，sax方式的。

对象的使用

Jsoup是一款Java的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。

步骤

导入jar包
获取Document对象
获取对应的标签Element对象
获取数据

Jsoup对象

Jsoup：工具类，可以解析html或xml文档，返回Document

parse：解析html或xml文档，返回Document
- parse (File in, String charsetName)：解析xml或html文件的。
- ~~parse (String html)：解析xml或html字符串~~
- parse (URL url, int timeoutMillis)：通过网络路径获取指定的html或xml的文档对象