javaweb学习第七天：jaxp的dom和sax对xml的解析

最新推荐文章于 2019-08-27 16:18:25 发布

风动云彩

最新推荐文章于 2019-08-27 16:18:25 发布

阅读量193

点赞数

本文链接：https://blog.csdn.net/qq_41300571/article/details/79566770

版权

1、xml的解析的简介（写到java代码）（***今天最重要的内容*****）
* xml是标记型文档
* js使用dom解析标记型文档？
- 根据html的层级结构，在内存中分配一个树形结构，把html的标签，属性和文本都封装成对象
- document对象、element对象、属性对象、文本对象、Node节点对象

* xml的解析方式（技术）：dom 和 sax
** 画图分析使用dom和sax解析xml过程
*** dom解析和sax解析区别：
** dom方式解析
* 根据xml的层级结构在内存中分配一个树形结构，把xml的标签，属性和文本都封装成对象
* 缺点：如果文件过大，造成内存溢出
* 优点：很方便实现增删改操作

** sax方式解析
* 采用事件驱动，边读边解析
- 从上到下，一行一行的解析，解析到某一个对象，返回对象名称
* 缺点：不能实现增删改操作
* 优点：如果文件过大，不会造成内存溢出，方便实现查询操作

* 想要解析xml，首先需要解析器
** 不同的公司和组织提供了针对dom和sax方式的解析器，通过api方式提供
*** sun公司提供了针对dom和sax解析器 jaxp
*** dom4j组织，针对dom和sax解析器 dom4j（*** 实际开发中****）
*** jdom组织，针对dom和sax解析器 jdom

2、jaxp的api的查看
** jaxp是javase的一部分

** jaxp解析器在jdk的javax.xml.parsers包里面
** 四个类：分别是针对dom和sax解析使用的类
*** dom：
DocumentBuilder : 解析器类
- 这个类是一个抽象类，不能new，
此类的实例可以从 DocumentBuilderFactory.newDocumentBuilder() 方法获取

- 一个方法，可以解析xml parse("xml路径") 返回是 Document 整个文档
- 返回的document是一个接口，父节点是Node，如果在document里面找不到想要的方法，到Node里面去找

- 在document里面方法
getElementsByTagName(String tagname)
-- 这个方法可以得到标签
-- 返回集合 NodeList

createElement(String tagName)
-- 创建标签

createTextNode(String data)
-- 创建文本

appendChild(Node newChild)
-- 把文本添加到标签下面

removeChild(Node oldChild)
-- 删除节点

getParentNode()
-- 获取父节点

NodeList list
- getLength() 得到集合的长度
- item(int index)下标取到具体的值
for(int i=0;i<list.getLength();i++) {
list.item(i)
}

getTextContent()
- 得到标签里面的内容

DocumentBuilderFactory：解析器工厂
- 这个类也是一个抽象类，不能new
newInstance() 获取 DocumentBuilderFactory 的实例。

*** sax：
SAXParser：解析器类
SAXParserFactory: 解析器工厂

3、使用jaxp实现查询操作
*** 查询xml中所有的name元素的值
* 步骤
//查询所有name元素的值
/*
* 1、创建解析器工厂
DocumentBuilderFactory.newInstance();
* 2、根据解析器工厂创建解析器
builderFactory.newDocumentBuilder();
* 3、解析xml返回document
* Document document = builder.parse("src/person.xml");
* 4、得到所有的name元素
使用document.getElementsByTagName("name");
* 5、返回集合，遍历集合，得到每一个name元素
- 遍历 getLength() item()
- 得到元素里面值使用 getTextContent()
* */

*** 查询xml中第一个name元素的值
* 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* 4、得到所有name元素
* 5、使用返回集合，里面方法 item，下标获取具体的元素
NodeList.item(下标)：集合下标从0开始
* 6、得到具体的值，使用 getTextContent方法
*
* */

20、使用jaxp添加节点
*** 在第一个p1下面（末尾）添加 <sex>nv</sex>
**步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* 4、得到第一个p1
* - 得到所有p1，使用item方法下标得到

* 5、创建sex标签 createElement
* 6、创建文本 createTextNode
* 7、把文本添加到sex下面 appendChild

* 8、把sex添加到第一个p1下面　appendChild
*
* 9、回写xml
* */

4、使用jaxp修改节点
*** 修改第一个p1下面的sex内容是nan
** 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* 4、得到sex item方法
* 5、修改sex里面的值
*** setTextContent方法
*
* 6、回写xml
* */

5、使用jaxp删除节点
*** 删除<sex>nan</sex>节点
** 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* 4、获取sex元素
* 5、获取sex的父节点使用getParentNode方法
* 6、删除使用父节点删除 removeChild方法
*
* 7、回写xml
* */

6、使用jaxp遍历节点
** 把xml中的所有元素名称打印出来
** 步骤
/*
* 1、创建解析器工厂
* 2、根据解析器工厂创建解析器
* 3、解析xml，返回document
*
* ====使用递归实现=====
* 4、得到根节点
* 5、得到根节点子节点
* 6、得到根节点子节点的子节点
* */
** 遍历的方法
//递归遍历的方法
private static void list1(Node node) {
//判断是元素类型时候才打印
if(node.getNodeType() == Node.ELEMENT_NODE) {
System.out.println(node.getNodeName());
}

//得到一层子节点
NodeList list = node.getChildNodes();
//遍历list
for(int i=0;i<list.getLength();i++) {
//得到每一个节点
Node node1 = list.item(i);
//继续得到node1的子节点
//node1.getChildNodes()
list1(node1);
}

}

7、sax解析的原理（********）
* 解析xml有两种技术 dom 和sax

* 根据xml的层级结构在内存中分配一个树形结构
** 把xml中标签，属性，文本封装成对象

* sax方式：事件驱动，边读边解析
* 在javax.xml.parsers包里面
** SAXParser
此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得
- parse(File f, DefaultHandler dh)
* 两个参数
** 第一个参数：xml的路径
** 事件处理器

** SAXParserFactory
实例 newInstance() 方法得到
* 画图分析一下sax执行过程
* 当解析到开始标签时候，自动执行startElement方法
* 当解析到文本时候，自动执行characters方法
* 当解析到结束标签时候，自动执行endElement方法

8、使用jaxp的sax方式解析xml（**会写***）
* sax方式不能实现增删改操作，只能做查询操作
** 打印出整个文档
*** 执行parse方法，第一个参数xml路径，第二个参数是事件处理器
*** 创建一个类，继承事件处理器的类，
***重写里面的三个方法

* 获取到所有的name元素的值
** 定义一个成员变量 flag= false
** 判断开始方法是否是name元素，如果是name元素，把flag值设置成true
** 如果flag值是true，在characters方法里面打印内容
** 当执行到结束方法时候，把flag值设置成false

* 获取第一个name元素的值
** 定义一个成员变量 idx=1
** 在结束方法时候，idx+1 idx++
** 想要打印出第一个name元素的值，
- 在characters方法里面判断，
-- 判断flag=true 并且 idx==1，在打印内容

风动云彩

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
javaweb学习第七天：jaxp的dom和sax对xml的解析

1、xml的解析的简介（写到java代码）（***今天最重要的内容*****） * xml是标记型文档 * js使用dom解析标记型文档？ - 根据html的层级结构，在内存中分配一个树形结构，把html的标签，属性和文本都封装成对象 - document对象、element对象、属性对象、文本对象、Node节点对象 * xml的解析方式（技术）：dom 和 sax ** 画图分析使用do...
复制链接

扫一扫