xml介绍与解析

最新推荐文章于 2024-11-14 06:13:48 发布

王放_

最新推荐文章于 2024-11-14 06:13:48 发布

阅读量107

点赞数

分类专栏： java web 文章标签： xml

本文链接：https://blog.csdn.net/weixin_43361158/article/details/89305500

版权

java web 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

本文详细介绍了XML(可扩展标记语言)的基本概念、与HTML的区别、语法规范、约束规则以及解析方法。涵盖了文档声明、元素、文本、属性、注释等内容，并探讨了DTD与Schema约束，以及DOM与SAX解析技术。

摘要由CSDN通过智能技术生成

一、XML定义

XML：Extensible Markup Language 可扩展标记语言 version=“1.0”
* 可扩展：所有的标签都是自定义的。
* 功能：数据存储
* 配置文件
* 数据传输

二、与HTML的区别

    * html语法松散，xml语法严格
	* html做页面展示，xml做数据存储
	* html所有标签都是预定义的，xml所有标签都是自定义的

三、xml的语法

xml语法：

文档声明：
* 必须写在xml文档的第一行。
* 写法：<?xml version="1.0" ?>
* 属性：
* version：版本号固定值 1.0
* encoding:指定文档的码表。默认值为 iso-8859-1
* standalone：指定文档是否独立 yes 或 no
元素：xml文档中的标签
* 文档中必须有且只能有一个根元素
* 元素需要正确闭合。

* 元素需要正确嵌套
* 元素名称要遵守：
* 元素名称区分大小写
* 数字不能开头

文本：

 	* 转义字符：&gt;
 	* CDATA: 里边的数据会原样显示
 		*  <![CDATA[ 数据内容 ]]>
 		
 * 属性：
 	* 属性值必须用引号引起来。单双引号都行
 * 注释：
 	<!-- -->
 * 处理指令：
 	<?xml-stylesheet type="text/css" href="1.css"?>

四、XML约束

约束就是xml的书写规则
dtd：
dtd分类：
* 内部dtd：在xml内部定义dtd
* 外部dtd：在外部文件中定义dtd
* 本地dtd文件：
* 网络dtd文件：

schema：

 		导入xsd约束文档：
 				1、编写根标签
 				2、引入实例名称空间 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 				3、引入名称空间 xsi:schemaLocation="http://www.itcast.cn/xml student.xsd"	
 				4、引入默认的名称空间

五、xml解析

解析xml可以做：
* 如果xml作为配置文件：读取
* 如果xml作为传输文件：写，读
xml解析思想：
DOM：

将文档加载进内存，形成一颗dom树(document对象)，将文档的各个组成部分封装为一些对象。
* 优点：因为，在内存中会形成dom树，可以对dom树进行增删改查。
* 缺点：dom树非常占内存，解析速度慢。

		Document
		Element
		Text
		Attribute
		Comment

SAX：
* 逐行读取，基于事件驱动
* 优点：不占内存，速度快
* 缺点：只能读取，不能回写

xml常用的解析器：
```
 * JAXP：sun公司提供的解析。支持dom和sax。
 * JDOM：
 * DOM4J：dom for java民间方式，但是是事实方式。非常好。  支持dom
 	1.导入jar包 dom4j.jar
 	2.创建解析器
 		SAXReader reader = new SAXReader();
 	3.解析xml 获得document对象 
 		Document document = reader.read(url); 
```
- XPATH：专门用于查询
  * 定义了一种规则。
  * 使用的方法：
  * selectSingleNode():
  * selectNodes():
  使用步骤：
  1、注意：要导包 jaxen…jar
  2、创建解析器
  SAXReader reader = new SAXReader();
  3、解析xml 获得document对象
  Document document = reader.read(url);
- 解析XML：
  1、得到某个具体的节点内容
  2、遍历所有元素节点
XPath：
nodename 选取此节点。
根节点选取。
从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。
选取当前节点的父节点。
@ 选取属性。
[@属性名] 属性过滤
[标签名] 子元素过滤