Schema,SAX,dom4j

day06
1.schema约束
dtd语法 :<!ELEMENT 元素名称 约束>
** schema符合xml语法,xml语句
** 一个xml中可以有多个schema,多个schema使用名称空间区分(类似于java包名)
** dtd里面有PCDATA类型,但是在schema里面可以支持更多数据类型
***比如  年龄 只能是整数类型,在schema可以直接定义一个整数类型
** schema语法更加复杂,schema目前还不能替代dtd


2.schema的快速入门
*创建一个schema文件 后缀名是.xsd
**根节点 <schema>


** 在schema文件里面
**属性 xmlns="http://www.w3.org/2001/XMLSchema"
-表示xml文件是一个约束文件
** targetNamespace="http://.itcast.cn/20151111"
-使用约束文件,直接通过这个地址引入约束文件
**

** 步骤
(1)看xml中有多少个元素
<element>
(2)看简单和复杂元素
*如果复杂元素
<complexType>
<sequence>
子元素
</sequence>
</complexType>
(3)简单元素,写在复杂元素的
<element name="person">
<complexType>
<sequence>
<element name="name" type="string"></element>
<element name="age" type="int"></element>
</sequence>
</complexType>
</element>
(4)在被约束文件里面引入约束文件
<person xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://.itcast.cn/20151111"
xsi:schemaLocation="http://.itcast.cn/20151111 1.xsd"
>


**xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
--表示一个被约束的文件
**xmlns="http://.itcast.cn/20151111"
    --是约束文档里面 targetNamespace
**xsi:schemaLocation="http://.itcast.cn/20151111 1.xsd"
--targetNamespace 空格 约束文档的地址路径


*<sequence>:表示元素出现的顺序
<all>:元素只能出现一次
<choice>:元素只能出现其中的一个
maxOccurs="unbounded":表示元素出现的次数
<any></any>:表示任意元素


*可以约束属性
*写在复杂元素里面
***写在</complexType>之前
--
<attribute name="id1" type="int" use="required"/>
</complexType>
-name:属性的名称
-type:属性的类型
-use:属性是否必须出现 required
*复杂的schema约束
<company xmlns = "http://www.example.org/company"
xmlns:dept="http://www.example.org/department"
xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.example.org/company  company.xsd http://www.example.org/department department.xsd"
>


<employee age="30">
<!--部门名称-->
<dept:name>100</dept:name>
<!--员工名称-->
<name>zhangsan</name>
</employee>


3.sax解析的原理
*解析xml有两种技术  dom和sax

*dom
*根据xml的层级结构在内存中分配一个树形结构
**把xml中标签,属性,文本封装成对象


*sax:时间驱动,边读边解析
*在java.xml.parsers包里面
**SAXParser
此类的实例可以从  SAXParserFactory.newSAXParser() 方法获得
-parse(String uri, DefaultHandler dh)
*两个参数
**第一个参数,xml的路径
**第二个参数:事件处理器
**SAXParserFactory
实例 newInstance()方法得到


*画图分析sax执行过程
*当解析到开始标签的时候,自动执行startElement方法
*当解析到文本的时候,自动执行characters方法
*当解析到结束标签的时候,自动执行endElement方法


4.使用jaxp的sax方式解析xml
*sax方式不能实现增删改操作,只能实现查询操作
**打印出整个文档
***执行parse方法,第一个参数xml路径,第二个参数是 时间处理器
*** 创建一个类,继承事件处理器的类
*** 重写里面的三个方法


*获取所有name元素的值
**定义一个成员变量 flag = false
**判断开始方法是否是name元素,如果是name元素,把flag值设置成true
**如果flag的值是true,在characters方法里面打印内容
**当执行到结束方法时,把flag值设置成false


*获取第一个name元素的值
**定义一个成员变量  index = 1;
**在结束方法的时候,index++;
**想要打印出第一个name元素的值
-在characters方法里面判断
--判断flag=true 并且 index==1,再打印内容


5.使用dom4j解析xml
*dom4j,是一个组织,针对xml解析,提供解析器dom4j

*dom4j不是javase的一部分,如果想要使用第一步应该怎么做
***导入dom4j提供jar包
--创建一个文件夹 lib
--复制jar包到lib的下面
--右键点击jar包,build path --- add to buildpath
--看到jar包变成了奶瓶的样子,表示导入成功


*得到document
SAXReader reader = new SAXReader();
Document document = reader.read(url);
*document的父接口是Node
*如果在document里面找不到想要的方法,到Node里面去找


*document里面的方法  getRootElement():获取根节点  返回的是Element


*Element也是一个接口,父接口是Node
-Element和node里面的方法
**getParent():获取父节点
**addElement:添加标签


6.使用dom4j查询xml
*解析是从上到下解析
*查询所有name元素里面的值
/*
1.创建解析器
2.得到document
3.得到根节点    getRootElement()  返回Element


4.得到所有p1标签
*element(qname)
**表示获取标签下面的第一个子标签
**qname:标签的名称
*elements(qname)
**获取标签下面是这个名称的所有子标签(一层)    
*elements("p1") 返回list集合  
*遍历list得到每一个p1
**qname:标签名称
*element()
**获取标签下面所有一层子标签
5.得到name
*在p1下面执行element("name")方法  返回 Element  
6.得到name里面的值
*getText方法得到值
*/




/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点

* 4.得到p1
* 5.得到p1下面的name
* 6.得到name里面的值
*/
//创建解析器
SAXReader saxReader = new SAXReader();
//得到document
Document document = saxReader.read("src/p1.xml");
//得到根节点
Element root = document.getRootElement();

//得到p1
List<Element> list = root.elements("p1");
//遍历list
for (Element element : list) {
//element是每一个p1元素
//得到p1下面的name元素
Element name1 = element.element("name");
//得到name里面的值
String s = name1.getText();
System.out.println(s);


*查询第一个name元素的值
//获取到第一个name元素的值
public static void selectSin() throws Exception{
/*1.创建解析器
*2. 得到document
* 3.得到根节点

* 4.得到第一个p1元素
* **element("p1")方法  返回Element
* 5.得到p1下面的name的元素
* **element("name")方法  返回Element
* 6.得到name元素的值
* **getText方法
* */
SAXReader saxReader = new SAXReader();
//得到document
Document document = saxReader.read("src/p1.xml");
Element root = document.getRootElement();


Element p1 = root.element("p1");
//得到p1下面的name元素
Element name1 = p1.element("name");
String s = name1.getText();
System.out.println(s);
}


*查询第二个name元素的值
//获取第二个name元素里面的值
public static void selectSecond() throws Exception{
/*1.创建解析器
*2. 得到document
* 3.得到根节点

* 4.得到所有p1元素
* 5.遍历得到第二个p1下面的name
* 7.得到name值
* * */
SAXReader saxReader = new SAXReader();
//得到document
Document document = saxReader.read("src/p1.xml");
Element root = document.getRootElement();
//得到所有的p1
List<Element> list = root.elements();
//得到第二个p1,list集合下标是从0开始
Element p2 = list.get(1);
//得到p1下面的name
Element name2 = p2.element("name");
String s2 =  name2.getText();
System.out.println(s2);
}


7.使用dom4j实现添加操作
*在第一个p1标签末尾添加一个元素  <sex>nv</sex>
//在第一个p1标签末尾添加一个元素  <sex>nv</sex>
public static void addSex() throws Exception{
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点

* 4.获取到第一个p1
* 5.在p1下面添加一个元素
* 6.在添加完成之后的元素的下面添加一个文本

* 7回写xml
* * */
//创建解析器
SAXReader saxReader = new SAXReader();
//得到document
Document document = saxReader.read("src/p1.xml");
//得到根节点
Element root =document.getRootElement();
//得到第一个p1元素
Element p1 = root.element("p1");
//在p1下面直接添加元素
Element sex1 = p1.addElement("sex");
//在sex下面来添加文本
sex1.setText("nv");
//回写XML
OutputFormat format = OutputFormat.createPrettyPrint(); //可以有缩进的效果
//OutputFormat format = OutputFormat.createCompactFormat();  //压缩格式
XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/p1.xml"),format);
xmlWriter.write(document);
xmlWriter.close();

}


8.使用dom4j实现在特定的位置添加元素
// *在第一个p1下面的age标签之前添加  <school>usc</school>
public static void addAgeBefore() throws Exception{
/*
* 1.创建解析器
* 2.得到document
* 3.得到根节点
* 4.得到第一个元素p1
* 5.获取p1下面的所有的元素
* **elements()返回list集合
* **使用list里面的方法,在特定位置添加元素
**首先创建元素,在元素下面创建文本
-使用DocumentHelper类方法createElement创建标签
-把文本添加到标签的下面  使用setText("文本内容")方法


* ***list集合里面的add(int index,E element)
* -第一个参数是位置下标,从0开始
* -第二个参数是要添加的元素
* 6.回写xml
* */
SAXReader reader = new SAXReader();
Document document = reader.read("src/p1.xml");
Element root = document.getRootElement();
Element p1 = root.element("p1");

//获取p1下面的所有元素
List<Element> list = p1.elements();

//创建元素使用
Element school = DocumentHelper.createElement("school");
//在school下面创建文本
school.setText("usc");

list.add(1,school);

//回写xml
OutputFormat format = OutputFormat.createPrettyPrint();
XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("src/p1.xml"),format);
xmlWriter.write(document);
xmlWriter.close();
}

**可以对得到的document的操和回写xml的操作,封装成方法
**也可以把传递的文件路径,封装成一个常量
****好处:可以提高开发速度,可以提高代码可维护性
-比如想要修改文件路径(名称),这个时候只需要修改常量的值即可,其他代码不需要任何的改变


9.使用dom4j实现修改节点的操作
*修改第一个p1下面的age元素的值  <age>30</age>
//修改第一个p1下面的age元素的值<age>30</age>
public static void modify() throws Exception{
/
* 1.得到document
* 2.得到得到p1元素
* 3.得到第一个p1下面的age
* 4.修改值是30
* -使用setText("文本内容")
* 5.回写xml 
* */
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
//得到第一个p1
Element root = document.getRootElement();
Element p1 = root.element("p1");
//得到p1下面的age
Element age = p1.element("age");
//修改age的值
age.setText("300");
//回写
Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);
}


10。使用dom4j实现删除节点
*删除第一个p1下面的A<school>ecit</school>元素
public static void delSch() throws Exception{
/*
* 1.得到document
* 2.得到根节点
* 3.得到第一个p1标签
* 4.得到p1下面的school
* 5.删除(使用p1删除school)

* 6.回写xml
*/
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
Element root = document.getRootElement();
Element p1 = root.element("p1");
Element school = p1.element("school");
//通过父节点删除
//school.getParent();   //获取school的父节点
p1.remove(school);

//回写xml
Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);
}


11.使用dom4j获取属性的值
*获取第一个p1里面的id1值
//获取第一个p1里面的属性id1的值
public static void getValue() throws Exception{
/*
* 1.得到document
* 2.得到根元素
* 3.得到第一个元素p1
* 4.得到p1里面的属性值
-p1.getAttributeValue("属性的名称")
*/
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
Element root = document.getRootElement();
Element p1 = root.element("p1");
String s = p1.attributeValue("id1");
System.out.println(s);
}


12.使用dom4j支持xpath操作
*可以直接获取到某个元素


*第一种形式
/AAA/DDD/BBB: 表示一层一层的,AAA下面的DDD下面的BBB
*第二种形式
//BBB:表示和这个名称相同,表示只要名称是BBB,都得到
*第三种形式
/*:表示所有的元素
*第四种形式
** BBB[1]:表示第一个BBB元素
** BBB[last()]:表示最后一个BBB元素
*第五种形式
** //BBB[@id]:表示只要BBB元素上面有id属性,都得到
*第六种形式
** //BBB[@id]:表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是b1


13使用dom4j支持xpath具体操作
**默认的情况下,dom4j不支持xpath
**如果想要在dom4j里面使用xpath
*第一步需要,引入支持xpath的jar包,使用jaxen-1.1-beta-6.jar
**需要把jar包导入到项目中    复制到项目中建的lib文件夹,然后  buildpath然后点addbuildpath 
**在dom4j里面提供了两个方法,用来支持xpath
**selectNodes("xpath表达式")
-获取多个节点
**selectSingleNode("xpath表达式")
-获取单一节点


**使用xpath实现:查询xml中所有name元素的值
** 所有name元素的xpath表示 : //name
** 使用selectNodes("//name");
/*1.得到document
*2.直接使用selectNodes("//name")方法得到name元素

*/
//得到document
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
List<Node> list = document.selectNodes("//name");
//遍历list集合
for (Node node : list) {
//node是每一个name元素
String s = node.getText();  //得到name元素具体的值
System.out.println(s);




**使用xpath实现:获取第一个p1下面的name的值
* //p1[@id1='aaa']/name
*使用selectSingleNode("xpath表达式")
/*
*1.得到document
*2.直接使用selectSingleNode方法实现
* -xpath://p1[@id1='aaa']/name
*/
Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);
Node name1 = document.selectSingleNode("//p1[@id1='aaa']/name");
String s = name1.getText();
System.out.println(s);
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值