XML

最新推荐文章于 2021-02-26 18:23:22 发布

柑橘栀子花0814

最新推荐文章于 2021-02-26 18:23:22 发布

阅读量674

点赞数 1

本文链接：https://blog.csdn.net/zhujunyu0814/article/details/90782371

版权

一、标记语言
1、超文本标记语言 HTML
(1)写法格式：<a href="link.html">link</a>
(2)关注数据的展示与用户体验
(3)标记是预定义、不可扩展的（如表示超链接）
2、可扩展的标记语言 XML
(1)写法格式：同 html 样式
(2)仅关注数据本身
(3)标记可扩展，可自定义
xml 和 Html 语言由同一种父语言 SGML(Standard Generalized Markup Language,标
准通用标记语言)发展出来的两种语言。
二、XML 作用
1、存储、交换数据
XML 只用元素和属性来描述数据，而不提供数据的显示方法，这使得 XML 具有能够运
行于不同系统平台之间和转换成不同格式目标文件。用 XML 在应用程序和公司之间
作数据交换，几个应用程序可以共享和解析同一个 XML 文件，不必使用传统的字符串
解析或拆解过程。
2、配置
许多应用都将配置数据存储在各种文件里，如 SSH、Android。使用 XML 配置文件的
应用程序能够方便地处理所需数据，不用像其它应用那样要经过重新编译才能修改和维
护应用系统。xml 比数据库占用的资源少，操作方便，用来存储简单的信息，现在主
要用在程序的配置文件上（比如 web.xml）。现在有越来越多的设备也支持 XML 了。
三、XML 示例
用 XML 存储已注册用户的数据方式
1、方式 1

<?xml version="1.0" encoding="UTF-8"?>
<people>
<person>
<name>白晶晶</name>
<age>28</age>
</person>
<person>
<name>至尊宝</name>
<age>300</age>
</person>
</people>

2、方式 2

<?xml version="1.0" encoding="UTF-8"?>
<people>
<person name="白晶晶" age="28"></person>
<person name="至尊宝" age="300"></person>
</people>

文档的后缀名是 xml，每个文档有且仅有一个根元素,所谓根元素就是包含了其他所有元
素的元素。XML 目前只有一个版本，即 1.0.XML 是自描述数据，使用现有的国际标准。
XML 中有格式良好(Well-formed)的 XML 和有效的(validate)XML。
四、格式良好的 xml
1、语法规范：
1)、必须有 XML 文档声明:

<?xml version="1.0"?>
<?xml version="1.0" encoding="UTF-8"?>
<?xml version="1.0" standalone="yes"?>
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>

	声明
<?	XML声明开始字符
xml	表示这是一份xml文件
version	用来指定xml的版本，默认值是“1.0”版本
standalone	表示该xml是不是独立的，如果yes，则表示这个xml文档独立的，不能引用外部的DTD规范文件；如果是no，则该xml文档不是独立的，表示可用引用外部的DTD规范文档。默认值是“yes”.
encoding	指定文件所有使用的字集编码，默认值是“utf-8”
？>	xml声明结束字符

说明:
XML standalone 定义了外部定义的 DTD 文件的存在性. standalone element 有效值
是 yes 和 no. 如下是一个例子:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!DOCTYPE s1 PUBLIC "http://www.ibm.com/example.dtd" "example.dtd">
<s1>.........</s1>

注意文本文件保存时候默认的编码格式是ANSI，需用记事本把它手动改为UTF-8保存。
2)、必须有且仅有一个根元素
3)、严格区分大小写
4)、属性值用引号(双引号或单引号) :等号分开的名称-值对；在一个元素上，相同的属
性只能出现一次
5)、标记成对；
6)、空标记关闭；
7)、元素正确嵌套。
2、元素命名规则
1)、名称中可以包含字母、数字或者其他可见字符；
2)、名称不能以数字开头；
3)、不能以 XML/xml/Xml…开头；
4)、名称中不能含空格；
5)、名称中不能含冒号（注：冒号留给命名空间使用）
3、实体
实体叫 ENTITY，实体的作用是避免重复输入。作用相当于宏或者变量。
1)内置的 5 种实体

实体 符号
&lt; <
&gt; >
&amp; &
&quot; "
&apos; '

2)自定义实体

<!DOCTYPE 根元素[
<!--实体声明-->
<!ENTITY 实体名 "实体内容">
]>

使用已定义的实体：&实体名;

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE sxt[
<!--实体声明-->
<!ENTITY xm "明明">
<!ENTITY gen "保密">
]>
<sxt>
<teacher>
 <name>明明</name>
 <gender>保密</gender>
 </teacher>
 <!--引用实体的方法-->
 <teacher>
 <name>&xm;</name>
 <gender>&gen;</gender>
 </teacher>
</sxt>

4、文档类型声明
文档类型定义——DOCTYPE，文档类型声明，紧跟 XML 声明之后，包含所有实体声明

<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE 根元素标记名[
<!--实体声明-->
]>

五、XML 解析(重点)
基本的解析方式有两种:一种叫 SAX，另一种叫 DOM。SAX(Simple API for XML)是基于
事件流的解析,DOM(Document Object Model)是基于 XML 文档树结构的解析。SAX:效
率高，数据量小，仅一次获取 ,DOM:整颗树加载到内存中，耗内存，可多次获取。
1、DOM 解析
与 js 中的类似，使用 JAXP（Java API for XML Parsing），即:用于 XML 解析的 Java API.
DOM(Document Object Model，文档对象模型)，在应用程序中，基于 DOM 的 XML
分析器将一个 XML 文档转换成一个对象模型的集合（通常称为 DOM 树），应用程序正
是通过对这个对象模型的操作，来实现对 XML 文档数据的操作。
XML 本身是以树状的形式出现的，所以 DOM 操作的时候，也将按章树的形式进行转换。
在整个 DOM 树种，最大的地方指的是 Document，表示一个文档，在这个文档中存在
一个根节点。
注意：在使用 DOM 操作的时候，每一个文字的区域也是一个节点，称为文本节点。
核心操作接口
在 DOM 解析中有以下四个核心的操作接口
Document : 此接口代表了整个 XML 文档，表示的是整棵 DOM 树的根，提供了对文
档中的数据进行访问和操作的入口，通过 Document 节点可以访问 XML 文件中所有的
元素内容。
Node : 此接口在整个 DOM 树种具有举足轻重的低位，DOM 操作的核心接口中有很大
一部分接口是从 Node 接口继承过来的。例如：Document、Element 等接口，在 DOM
树种，每一个 Node 接口代表了 DOM 树种的一个节点。
NodeList : 此接口表示的是一个节点的集合，一般用于表示有顺序关系的一组节点，
例如：一个节点的子节点，当文档改变的时候会直接影响到 NodeList 集合。
NamedNodeMap : 此接口表示的是一组节点和其唯一名字对应的一一对应关系，本
接口主要用于属性节点的表示上。
DOM 解析过程
如果一个程序需要进行 DOM 解析读取操作的话，也需要按照如下的步骤进行：

① 建立 DocumentBuilderFactory : DocumentBuilderFactory factory =
DocumentBuilderFactory.newInstance();
②建立 DocumentBuilder: DocumentBuilder builder = factory.newDocumentBuilder();
③建立 Document : Document doc = builder.parse(“要解析的文件路径”);
④建立 NodeList : NodeList nl = doc.getElementsByTagName(“读取节点”);
⑤进行 XML 信息读取

DOM 操作除了可以进行解析外,也可以进行文档的生成
如果想要生成 XML 文件,则在创建文档的时候,就应该使用 newDocument()方法
如果要将 DOM 的文档输出，本身是比较麻烦的。一次编写多次 copy

public static void createXml() throws Exception{
//获取解析器工厂
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
//获取解析器
DocumentBuilder builder=factory.newDocumentBuilder();
//创建文档
Document doc=builder.newDocument();
//创建元素、设置关系
Element root=doc.createElement("people");
Element person=doc.createElement("person");
Element name=doc.createElement("name");
Element age=doc.createElement("age");
name.appendChild(doc.createTextNode("shsxt"));
age.appendChild(doc.createTextNode("10"));
doc.appendChild(root);
root.appendChild(person);
person.appendChild(name);
person.appendChild(age);
//写出去
// 获得变压器工厂
TransformerFactory tsf=TransformerFactory.newInstance();
Transformer ts=tsf.newTransformer();
//设置编码
ts.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
//创建带有DOM节点的新输入源，充当转换Source树的持有者
DOMSource source=new DOMSource(doc);
//充当转换结果的持有者
File file=new File("src/output.xml");
StreamResult result=new StreamResult(file);
ts.transform(source, result);
}

2、SAX 解析
SAX(Simple API for XML)解析是按照 xml 文件的顺序一步一步的来解析。SAX 没有官方
的标准机构，它不属于任何标准阻止或团体，也不属于任何公司或个人，而是提供任何
人使用的一种计算机技术。

// 1、创建解析器工厂
SAXParserFactory factory = SAXParserFactory.newInstance();
// 2、获得解析器
SAXParser parser = factory.newSAXParser();
// SAX解析器 ，继承 DefaultHandler
String path = new File("resource/demo01.xml").getAbsolutePath();
// 解析
parser.parse(path, new MySaxHandler());

3、DOM4j 解析
dom4j 是一个简单的开源库，用于处理 XML、 XPath 和 XSLT，它基于 Java 平台，使
用 Java 的集合框架，全面集成了 DOM，SAX 和 JAXP。下载路径:
http://www.dom4j.org/dom4j-1.6.1/
http://sourceforge.net/projects/dom4j
可以使用 DOM4J 进行 XML 文件的读、写操作
DOM4J 与 JDOM 一样都属于一个免费的 XML 开源组建，但是由于现在的开发框架中使
用该技术较多，比如 Hibernate、Spring 等都使用 DOM4J 这个功能，所以作为介绍，
大家可以对该组件有一个了解。并没有谁好谁坏，一般框架使用 DOM4J 较多，而我们
平时如果要用则 JDOM 较常见。
解析

File file = new File("resource/outputdom4j.xml");
SAXReader reader = new SAXReader();
// 读取文件作为文档
Document doc = reader.read(file);
// 获取文档的根元素
Element root = doc.getRootElement();
// 根据跟元素找到全部的子节点
Iterator<Element> iter = root.elementIterator();
while(iter.hasNext()){
Element name = iter.next();
System.out.println("value = " + name.getText());
}

创建

// 使用DocumentHelper来创建 Document对象
Document document = DocumentHelper.createDocument();
// 创建元素并设置关系
Element person = document.addElement("person");
Element name = person.addElement("name");
Element age = person.addElement("age");
// 设置文本
name.setText("shsxt");
age.setText("10");
// 创建格式化输出器
OutputFormat of = OutputFormat.createPrettyPrint();
of.setEncoding("utf-8");
// 输出到文件
File file = new File("resource/outputdom4j.xml");
XMLWriter writer = new XMLWriter(new FileOutputStream(new
File(file.getAbsolutePath())),of);
// 写出
writer.write(document);
writer.flush();
writer.close();

4、JDOM 解析
JDOM 主要操作的类：
解析

// 获取SAX解析器
SAXBuilder builder = new SAXBuilder();
File file = new File("resource/demo01.xml");
// 获取文档
Document doc = builder.build(new File(file.getAbsolutePath()));
// 获取根节点
Element root = doc.getRootElement();
System.out.println(root.getName());
// 获取根节点下所有的子节点， 也可以根据标签名称获取指定的直接点
List<Element> list = root.getChildren();
System.out.println(list.size());
for(int x = 0; x<list.size(); x++){
Element e = list.get(x);
// 获取元素的名称和里面的文本
String name = e.getName();
System.out.println(name + "=" + e.getText());
System.out.println("==================");}

创建

// 创建节点
Element person = new Element("person");
Element name = new Element("name");
Element age = new Element("age");
// 创建属性
Attribute id = new Attribute("id","1");
// 设置文本
name.setText("shsxt");
age.setText("10");
// 设置关系
Document doc = new Document(person);
person.addContent(name);
name.setAttribute(id);
person.addContent(age);
XMLOutputter out = new XMLOutputter();
File file = new File("resource/outputjdom.xml");
out.output(doc, new FileOutputStream(file.getAbsoluteFile()));

柑橘栀子花0814

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
XML

一、标记语言1、超文本标记语言 HTML(1)写法格式：<a href="link.html">link</a>(2)关注数据的展示与用户体验(3)标记是预定义、不可扩展的（如表示超链接）2、可扩展的标记语言 XML(1)写法格式：同 html 样式(2)仅关注数据本身(3)标记可扩展，可自定义xml 和 Html 语言由同一种父语言 SGML(Sta...
复制链接

扫一扫