Schema,SAX,dom4j

最新推荐文章于 2021-04-23 07:56:57 发布

HollowKnight

最新推荐文章于 2021-04-23 07:56:57 发布

阅读量182

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HollowKnight/article/details/79483289

版权

day06
1.schema约束
dtd语法 :<!ELEMENT 元素名称约束>
** schema符合xml语法，xml语句
** 一个xml中可以有多个schema,多个schema使用名称空间区分(类似于java包名)
** dtd里面有PCDATA类型，但是在schema里面可以支持更多数据类型
***比如年龄只能是整数类型，在schema可以直接定义一个整数类型
** schema语法更加复杂，schema目前还不能替代dtd

2.schema的快速入门
*创建一个schema文件后缀名是.xsd
**根节点 <schema>

** 在schema文件里面
**属性 xmlns="http://www.w3.org/2001/XMLSchema"
-表示xml文件是一个约束文件
** targetNamespace="http://.itcast.cn/20151111"
-使用约束文件，直接通过这个地址引入约束文件
**

** 步骤
(1)看xml中有多少个元素
<element>
(2)看简单和复杂元素
*如果复杂元素
<complexType>
<sequence>
子元素
</sequence>
</complexType>
（3）简单元素，写在复杂元素的
<element name="person">
<complexType>
<sequence>
<element name="name" type="string"></element>
<element name="age" type="int"></element>
</sequence>
</complexType>
</element>
（4）在被约束文件里面引入约束文件
<person xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://.itcast.cn/20151111"
xsi:schemaLocation="http://.itcast.cn/20151111 1.xsd"
>

**xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
--表示一个被约束的文件
**xmlns="http://.itcast.cn/20151111"
--是约束文档里面 targetNamespace
**xsi:schemaLocation="http://.itcast.cn/20151111 1.xsd"
--targetNamespace 空格约束文档的地址路径

*<sequence>:表示元素出现的顺序
<all>:元素只能出现一次
<choice>:元素只能出现其中的一个
maxOccurs="unbounded":表示元素出现的次数
<any></any>:表示任意元素

*可以约束属性
*写在复杂元素里面
***写在</complexType>之前
--
<attribute name="id1" type="int" use="required"/>
</complexType>
-name:属性的名称
-type:属性的类型
-use:属性是否必须出现 required
*复杂的schema约束
<company xmlns = "http://www.example.org/company"
xmlns:dept="http://www.example.org/department"
xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.example.org/company company.xsd http://www.example.org/department department.xsd"
>

<employee age="30">

<dept:name>100</dept:name>

<name>zhangsan</name>
</employee>

3.sax解析的原理
*解析xml有两种技术 dom和sax

*dom
*根据xml的层级结构在内存中分配一个树形结构
**把xml中标签，属性，文本封装成对象

*sax：时间驱动，边读边解析
*在java.xml.parsers包里面
**SAXParser
此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得
-parse(String uri, DefaultHandler dh)
*两个参数
**第一个参数，xml的路径
**第二个参数:事件处理器
**SAXParserFactory
实例 newInstance()方法得到

*画图分析sax执行过程
*当解析到开始标签的时候，自动执行startElement方法
*当解析到文本的时候，自动执行characters方法
*当解析到结束标签的时候，自动执行endElement方法

4.使用jaxp的sax方式解析xml
*sax方式不能实现增删改操作，只能实现查询操作
**打印出整个文档
***执行parse方法，第一个参数xml路径，第二个参数是时间处理器
*** 创建一个类，继承事件处理器的类
*** 重写里面的三个方法

*获取所有name元素的值
**定义一个成员变量 flag = false
**判断开始方法是否是name元素，如果是name元素，把flag值设置成true
**如果flag的值是true，在characters方法里面打印内容
**当执行到结束方法时，把flag值设置成false

*获取第一个name元素的值
**定义一个成员变量 index = 1;
**在结束方法的时候，index++;
**想要打印出第一个name元素的值
-在characters方法里面判断
--判断flag=true 并且 index==1,再打印内容

5.使用dom4j解析xml
*dom4j,是一个组织，针对xml解析，提供解析器dom4j

*dom4j不是javase的一部分，如果想要使用第一步应该怎么做
***导入dom4j提供jar包
--创建一个文件夹 lib
--复制jar包到lib的下面
--右键点击jar包，build path --- add to buildpath
--看到jar包变成了奶瓶的样子，表示导入成功

*得到document
SAXReader reader = new SAXReader();
Document document = reader.read(url);
*document的父接口是Node
*如果在document里面找不到想要的方法，到Node里面去找

*document里面的方法 getRootElement():获取根节点返回的是Element

*Element也是一个接口，父接口是Node
-Element和node里面的方法
**getParent():获取父节点
**addElement:添加标签

6.使用dom4j查询xml
*解析是从上到下解析
*查询所有name元素里面的值
/*
1.创建解析器
2.得到document
3.得到根节点 getRootElement() 返回Element

4.得到所有p1标签
*element(qname)
**表示获取标签下面的第一个子标签
**qname:标签的名称
*elements(qname)
**获取标签下面是这个名称的所有子标签（一层）
*elements("p1") 返回list集合
*遍历list得到每一个p1
**qname：标签名称
*element()
**获取标签下面所有一层子标签
5.得到name
*在p1下面执行element("name")方法返回 Element
6.得到name里面的值
*getText方法得到值
*/

/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
*
* 4.得到p1
* 5.得到p1下面的name
* 6.得到name里面的值
*/
//创建解析器
SAXReader saxReader = new SAXReader();
//得到document
Document document = saxReader.read("src/p1.xml");
//得到根节点
Element root = document.getRootElement();

//得到p1
List<Element> list = root.elements("p1");
//遍历list
for (Element element : list) {
//element是每一个p1元素
//得到p1下面的name元素
Element name1 = element.element("name");
//得到name里面的值
String s = name1.getText();
System.out.println(s);

*查询第一个name元素的值
//获取到第一个name元素的值
public static void selectSin() throws Exception{
/*1.创建解析器
*2. 得到document
* 3.得到根节点
*
* 4.得到第一个p1元素
* **element("p1")方法返回Element
* 5.得到p1下面的name的元素
* **element("name")方法返回Element
* 6.得到name元素的值
* **getText方法
* */
SAXReader saxReader = new SAXReader();
//得到document
Document document = saxReader.read("src/p1.xml");
Element root = document.getRootElement();

Element p1 = root.element("p1");
//得到p1下面的name元素
Element name1 = p1.element("name");
String s = name1.getText();
System.out.println(s);
}

*查询第二个name元素的值
//获取第二个name元素里面的值
public static void selectSecond() throws Exception{
/*1.创建解析器
*2. 得到document
* 3.得到根节点
*
* 4.得到所有p1元素
* 5.遍历得到第二个p1下面的name
* 7.得到name值
* * */
SAXReader saxReader = new SAXReader();
//得到document
Document document = saxReader.read("src/p1.xml");
Element root = document.getRootElement();
//得到所有的p1
List<Element> list = root.elements();
//得到第二个p1,list集合下标是从0开始
Element p2 = list.get(1);
//得到p1下面的name
Element name2 = p2.element("name");
String s2 = name2.getText();
System.out.println(s2);
}

7.使用dom4j实现添加操作
*在第一个p1标签末尾添加一个元素 <sex>nv</sex>
//在第一个p1标签末尾添加一个元素 <sex>nv</sex>
public static void addSex() throws Exception{
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
*
* 4.获取到第一个p1
* 5.在p1下面添加一个元素
* 6.在添加完成之后的元素的下面添加一个文本
*
* 7回写xml
* * */
//创建解析器
SAXReader saxReader = new SAXReader();
//得到document
Document document = saxReader.read("src/p1.xml");
//得到根节点
Element root =document.getRootElement();
//得到第一个p1元素
Element p1 = root.element("p1");
//在p1下面直接添加元素
Element sex1 = p1.addElement("sex");
//在sex下面来添加文本
sex1.setText("nv");
//回写XML
OutputFormat format = OutputFormat.createPrettyPrint(); //可以有缩进的效果
//OutputFormat format = OutputFormat.createCompactFormat(); //压缩格式
XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/p1.xml"),format);
xmlWriter.write(document);
xmlWriter.close();

}

8.使用dom4j实现在特定的位置添加元素
// *在第一个p1下面的age标签之前添加 <school>usc</school>
public static void addAgeBefore() throws Exception{
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
* 4.得到第一个元素p1
* 5.获取p1下面的所有的元素
* **elements()返回list集合
* **使用list里面的方法，在特定位置添加元素
**首先创建元素，在元素下面创建文本
-使用DocumentHelper类方法createElement创建标签
-把文本添加到标签的下面使用setText("文本内容")方法

* ***list集合里面的add(int index,E element)
* -第一个参数是位置下标，从0开始
* -第二个参数是要添加的元素
* 6.回写xml
* */
SAXReader reader = new SAXReader();
Document document = reader.read("src/p1.xml");
Element root = document.getRootElement();
Element p1 = root.element("p1");

//获取p1下面的所有元素
List<Element> list = p1.elements();

//创建元素使用
Element school = DocumentHelper.createElement("school");
//在school下面创建文本
school.setText("usc");

list.add(1,school);

//回写xml
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/p1.xml"),format);
xmlWriter.write(document);
xmlWriter.close();
}

**可以对得到的document的操和回写xml的操作，封装成方法
**也可以把传递的文件路径，封装成一个常量
****好处:可以提高开发速度，可以提高代码可维护性
-比如想要修改文件路径(名称)，这个时候只需要修改常量的值即可，其他代码不需要任何的改变

9.使用dom4j实现修改节点的操作
*修改第一个p1下面的age元素的值 <age>30</age>
//修改第一个p1下面的age元素的值<age>30</age>
public static void modify() throws Exception{
/
* 1.得到document
* 2.得到得到p1元素
* 3.得到第一个p1下面的age
* 4.修改值是30
* -使用setText("文本内容")
* 5.回写xml
* */
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
//得到第一个p1
Element root = document.getRootElement();
Element p1 = root.element("p1");
//得到p1下面的age
Element age = p1.element("age");
//修改age的值
age.setText("300");
//回写
Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);
}

10。使用dom4j实现删除节点
*删除第一个p1下面的A<school>ecit</school>元素
public static void delSch() throws Exception{
/*
* 1.得到document
* 2.得到根节点
* 3.得到第一个p1标签
* 4.得到p1下面的school
* 5.删除(使用p1删除school)
*
* 6.回写xml
*/
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
Element root = document.getRootElement();
Element p1 = root.element("p1");
Element school = p1.element("school");
//通过父节点删除
//school.getParent(); //获取school的父节点
p1.remove(school);

//回写xml
Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);
}

11.使用dom4j获取属性的值
*获取第一个p1里面的id1值
//获取第一个p1里面的属性id1的值
public static void getValue() throws Exception{
/*
* 1.得到document
* 2.得到根元素
* 3.得到第一个元素p1
* 4.得到p1里面的属性值
-p1.getAttributeValue("属性的名称")
*/
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
Element root = document.getRootElement();
Element p1 = root.element("p1");
String s = p1.attributeValue("id1");
System.out.println(s);
}

12.使用dom4j支持xpath操作
*可以直接获取到某个元素

*第一种形式
/AAA/DDD/BBB: 表示一层一层的，AAA下面的DDD下面的BBB
*第二种形式
//BBB:表示和这个名称相同，表示只要名称是BBB,都得到
*第三种形式
/*：表示所有的元素
*第四种形式
** BBB[1]:表示第一个BBB元素
** BBB[last()]:表示最后一个BBB元素
*第五种形式
** //BBB[@id]:表示只要BBB元素上面有id属性，都得到
*第六种形式
** //BBB[@id]:表示元素名称是BBB,在BBB上面有id属性，并且id的属性值是b1

13使用dom4j支持xpath具体操作
**默认的情况下，dom4j不支持xpath
**如果想要在dom4j里面使用xpath
*第一步需要，引入支持xpath的jar包，使用jaxen-1.1-beta-6.jar
**需要把jar包导入到项目中复制到项目中建的lib文件夹，然后 buildpath然后点addbuildpath
**在dom4j里面提供了两个方法，用来支持xpath
**selectNodes("xpath表达式")
-获取多个节点
**selectSingleNode("xpath表达式")
-获取单一节点

**使用xpath实现：查询xml中所有name元素的值
** 所有name元素的xpath表示 : //name
** 使用selectNodes("//name");
/*1.得到document
*2.直接使用selectNodes("//name")方法得到name元素
*
*/
//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
List<Node> list = document.selectNodes("//name");
//遍历list集合
for (Node node : list) {
//node是每一个name元素
String s = node.getText(); //得到name元素具体的值
System.out.println(s);

**使用xpath实现：获取第一个p1下面的name的值
* //p1[@id1='aaa']/name
*使用selectSingleNode("xpath表达式")
/*
*1.得到document
*2.直接使用selectSingleNode方法实现
* -xpath://p1[@id1='aaa']/name
*/
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
Node name1 = document.selectSingleNode("//p1[@id1='aaa']/name");
String s = name1.getText();
System.out.println(s);

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Schema,SAX,dom4j

day061.schema约束 dtd语法 :&lt;!ELEMENT 元素名称约束&gt; ** schema符合xml语法，xml语句 ** 一个xml中可以有多个schema,多个schema使用名称空间区分(类似于java包名) ** dtd里面有PCDATA类型，但是在schema里面可以支持更多数据类型 ***比如年龄只能是整数类型，在schema可以直接定义一个整数类型 *...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。