XML

cheng.kong

于 2019-10-21 18:25:12 发布

阅读量184

点赞数

分类专栏： java基础篇

本文链接：https://blog.csdn.net/weixin_41844743/article/details/102669235

版权

java基础篇专栏收录该内容

16 篇文章 0 订阅

订阅专栏

dom4j-1.6.1.jar链接 https://pan.baidu.com/s/1exfHA5d8_hTfRLbkR7yUTg

1.申明xml文件

<?xml version="1.0" encoding="UTF-8"?>

2.申明dtd

2.1申明内部dtd

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE books [ 
     <!ELEMENT books (book+)>                      注：+表示出现1次或多次      ?表示0次1次       *表示出现任意次 
	 <!ELEMENT book (name,author,price)>           
	 <!ATTLIST book id CDATA #REQUIRED>            注：#REQUIRED表示必须出现   #IMPLIED表示不是必须的
	 <!ELEMENT name (#PDATA)>
	 <!ELEMENT name (#PDATA)>
	 <!ELEMENT name (#PDATA)>
]>
<books>
       <book id="1">
             <name>语文</name>
             <author>张三</author>
             <price>12.2</price>
       </book>
       <book id="2">
             <name>数学</name>
             <author>李四</author>
             <price>15</price>
       </book>
</books>

2.2申明外部dtd

a.创建一个独立的dtd文件

<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT books (book+)>                      
<!ELEMENT book (name,author,price)>           
<!ATTLIST book id CDATA #REQUIRED>            
<!ELEMENT name (#PDATA)>
<!ELEMENT name (#PDATA)>
<!ELEMENT name (#PDATA)>

b.在xml中引入外部dtd

<!-- 引入外部dtd文件 -->
<!DOCTYPE books SYSTEM "books.dtd">

3.XML的生成与解析

3.1解析XML

public class XmlTest {
    public static void main(String[] args) throws Exception {
        //1.用于创建SAXReader对象，用于读取xml文件
        SAXReader raeder = new SAXReader();
        //2.读取xml文件，获取Document对象
        Document doc = raeder.read(new File("src/book.xml"));
        //3.获取根元素
        Element root = doc.getRootElement();
        //4.获取根元素所有子元素
        Iterator it = root.elementIterator();
        while(it.hasNext()){
            //取出元素
            Element e = (Element) it.next();
            //获取id属性
            Attribute a = e.attribute("id");
            //取出子元素
            Element name = e.element("name");
            Element author = e.element("author");
            Element price = e.element("price");
        }
        System.out.println(root);
    }
}

3.1生成XML

public class XmlTest2 {
    public static void main(String[] args) throws Exception {
        //1.通过DocumentHelper生成Document对象
        Document doc = DocumentHelper.createDocument();
        //2.添加并得到根元素
        Element e = doc.addElement("books");
        //3.为根元素添加子元素
        Element book = e.element("book");
        //4.添加属性
        book.addAttribute("id","b01");
        //5.添加元素
        Element name = book.addElement("name");
        Element author = book.addElement("author");
        Element price = book.addElement("price");
        //6.为元素添加文本
        name.addText("语文");
        author.addText("张三");
        price.addText("15");
        //7.将doc输出到xml文件
        OutputFormat format = OutputFormat.createPrettyPrint();
        XMLWriter writer = new XMLWriter(new FileWriter(new File("src/book2.xml")),format);
        writer.write(doc);
        //8.关闭资源
        writer.close();
    }
}

long start = System.currentTimeMillis();

常用方法：startElement、endElement、characters

SAX方式解析XML文档

使用SAXParserFactory创建SAX解析工厂

SAXParserFactory spf = SAXParserFactory.newInstance();

2）通过SAX解析工厂得到解析器对象

SAXParser sp = spf.newSAXParser();

3）通过解析器对象得到一个XML的读取器

XMLReader xmlReader = sp.getXMLReader();

4）设置读取器的事件处理器

xmlReader.setContentHandler(new BookParserHandler());

5）解析xml文件

xmlReader.parse("book.xml");

DOM4J解析XML文档

1）Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是，dom4j使用接口和抽象基类，虽然Dom4j的API相对要复杂一些，但它提供了比JDOM更好的灵活性。

2）Dom4j是一个非常优秀的Java XML API，具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j，例如Hibernate，包括sun公司自己的JAXM也用了Dom4j。

3）使用Dom4j开发，需下载dom4j相应的jar文件。

Document对象

DOM4j中，获得Document对象的方式有三种：

1.读取XML文件,获得document对象

SAXReader reader = new SAXReader();
Document document = reader.read(new File("input.xml"));

2.解析XML形式的文本,得到document对象.

String text = "<members></members>";
Document document = DocumentHelper.parseText(text);

3.主动创建document对象.

Document document = DocumentHelper.createDocument();
//创建根节点

Element root = document.addElement("members");

节点对象

1.获取文档的根节点.

Element root = document.getRootElement();

2.取得某个节点的子节点.

Element element=node.element(“书名");

3.取得节点的文字

String text=node.getText();

4.取得某节点下所有名为“member”的子节点，并进行遍历.
List nodes = rootElm.elements("member");
for (Iterator it = nodes.iterator(); it.hasNext();) {
     Element elm = (Element) it.next();
    // do something
   }

5.对某节点下的所有子节点进行遍历.
   for(Iterator it=root.elementIterator();it.hasNext();){
       Element element = (Element) it.next();
       // do something
    }

6.在某节点下添加子节点.
Element ageElm = newMemberElm.addElement("age");

7.设置节点文字.
element.setText("29");

8.删除某节点.
//childElm是待删除的节点,parentElm是其父节点

parentElm.remove(childElm);

9.添加一个CDATA节点.
Element contentElm = infoElm.addElement("content");
contentElm.addCDATA(diary.getContent());

节点对象属性

1.取得某节点下的某属性
Element root=document.getRootElement();
//属性名name

Attribute attribute=root.attribute("size");

2.取得属性的文字
String text=attribute.getText();

3.删除某属性
Attribute attribute=root.attribute("size");
root.remove(attribute);

4.遍历某节点的所有属性
   Element root=document.getRootElement();
for(Iterator it=root.attributeIterator();it.hasNext();){
         Attribute attribute = (Attribute) it.next();
         String text=attribute.getText();
         System.out.println(text);
    }

5.设置某节点的属性和文字.
newMemberElm.addAttribute("name", "sitinspring");

6.设置属性的文字
Attribute attribute=root.attribute("name");
attribute.setText("sitinspring");

将文档写入XML文件

1.文档中全为英文,不设置编码,直接写入的形式.
    XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
    writer.write(document);
    writer.close();

2.文档中含有中文,设置编码格式写入的形式.
OutputFormat format = OutputFormat.createPrettyPrint();
// 指定XML编码

format.setEncoding("GBK");
XMLWriter writer =

new XMLWriter(newFileWriter("output.xml"),format);
writer.write(document);
writer.close();

DTD(Document Type Definition)，全称为文档类型定义。

DTD约束的两种方式

1 DTD约束即可以作为一个单独的文件编写，也可以在XML文件内编写。

2. 在xml文件内编写DTD

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>

<!DOCTYPE 书架 [

<!ELEMENT 书架 (书+)>

<!ELEMENT 书 (书名,作者,售价)>

<!ELEMENT 书名 (#PCDATA)>

<!ELEMENT 作者 (#PCDATA)>

<!ELEMENT 售价 (#PCDATA)>

<书架>

<书>

<书名>Java</书名>

<作者>xx</作者>

<售价>85元</售价>

</书>

...

</书架>

XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件，DOCTYPE声明语句有两种形式：

1.当引用的文件在本地时，采用如下方式：

<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">

例如： <!DOCTYPE 书架 SYSTEM “book.dtd”>

2.当引用的文件是一个公共的文件时，采用如下方式：

<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">

例如：<!DOCTYPE web-app PUBLIC

"-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">

DTD约束语法细节

元素定义
属性定义
实体定义

元素定义

在DTD文档中使用ELEMENT声明一个XML元素，语法格式如下所示：

<!ELEMENT 元素名称元素类型>

元素类型可以是元素内容、或类型

如为元素内容：则需要使用()括起来，如

<!ELEMENT 书架 (书名，作者，售价)>

<!ELEMENT 书名 (#PCDATA)>

如为元素类型，则直接书写，DTD规范定义了如下几种类型：

EMPTY：用于定义空元素，例如<br/> <hr/>

ANY：表示元素内容为任意类型。

元素内容中可以使用如下方式，描述内容的组成关系

1）元素内容使用空白符分隔，表示出现顺序没有要<!ELEMENT MYFILE (TITLE AUTHOR EMAIL)>

2）用逗号分隔，表示内容的出现顺序必须与声明时一致。

<!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>

3）用|分隔，表示任选其一，即多个只能出现一个

<!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>

在元素内容中也可以使用+、*、?等符号表示元素出现的次数：

+: 一次或多次 (书+)

?: 0次或一次 (书?)

*: 0次或多次 (书*)

也可使用圆括号( )批量设置，例

<!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

属性定义

xml文档中的标签属性需通过ATTLIST为其设置属性

语法格式：

<!ATTLIST 元素名

属性名1 属性值类型设置说明

属性名2 属性值类型设置说明

……

属性声明举例：

<!ATTLIST 商品

类别 CDATA #REQUIRED

颜色 CDATA #IMPLIED

对应XML文件：

<商品类别="服装" 颜色="黄色">…</商品>

<商品类别="服装">…</商品>

设置说明：

#REQUIRED：必须设置该属性

#IMPLIED：可以设置也可以不设置

#FIXED：说明该属性的取值固定为一个值，在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值

直接使用默认值：在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。

举例：

<!ATTLIST 页面作者

姓名 CDATA #IMPLIED

年龄 CDATA #IMPLIED

联系信息 CDATA #REQUIRED

网站职务 CDATA #FIXED "页面作者"

个人爱好 CDATA "上网"

常用属性值类型

CDATA：表示属性值为普通文本字符串。

ENUMERATED

ENTITY(实体)

属性值类型àENUMERATED

属性的类型可以是一组取值的列表，在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举)

<?xml version = "1.0" encoding="GB2312" standalone="yes"?>

<!DOCTYPE 购物篮 [

<!ELEMENT 肉 EMPTY>

<!ATTLIST 肉品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉">

<购物篮>

<肉品种="鱼肉"/>

<肉品种="牛肉"/>

<肉/>

</购物篮>

属性值类型à ID

表示属性的设置值为一个唯一值。

ID 属性的值只能由字母，下划线开始，不能出现空白字符

<?xml version = "1.0" encoding="GB2312" ?>

<!DOCTYPE 联系人列表[

<!ELEMENT 联系人列表 ANY>

<!ELEMENT 联系人(姓名,EMAIL)>

<!ELEMENT 姓名(#PCDATA)>

<!ELEMENT EMAIL(#PCDATA)>

<!ATTLIST 联系人编号 ID #REQUIRED>

<联系人列表>

<联系人编号="1">

<姓名>张三</姓名>

<EMAIL>zhang@163.com</EMAIL>

</联系人>

<联系人编号="2">

<姓名>李四</姓名>

</联系人>

</联系人列表>

实体定义

实体用于为一段内容创建一个别名，以后在XML文档中就可以使用别名引用这段内容了。

在DTD定义中，一条<!ENTITY …>语句用于定义一个实体。

实体可分为两种类型：引用实体和参数实体。

实体定义à引用实体

引用实体主要在 XML 文档中被应用

语法格式：

<!ENTITY 实体名称 “实体内容” >：直接转变成实体内容

引用方式：

&实体名称;

举例：

<!ENTITY copyright “I am a programmer">

……

&copyright;

实体定义à参数实体

参数实体被 DTD 文件自身使用

语法格式：

<!ENTITY % 实体名称 "实体内容" >

引用方式：

%实体名称;

举例1：

<!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">

<!ELEMENT 个人信息 (%TAG_NAMES; | 生日)>

<!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)>

举例2：

<!ENTITY % common.attributes

" id ID #IMPLIED

account CDATA #REQUIRED "

...

<!ATTLIST purchaseOrder %common.attributes;>

<!ATTLIST item %common.attributes;>

XML Schema

XML Schema 也是一种用于定义和描述 XML 文档结构与内容的模式语言，其出现是为了克服 DTD 的局限性

XML Schema VS DTD：

- XML Schema符合XML语法结构。
- DOM、SAX等XML API很容易解析出XML Schema文档中的内容。
- XML Schema对名称空间支持得非常好。
- XML Schema比XML DTD支持更多的数据类型，并支持用户自定义新的数据类型。
- XML Schema定义约束的能力非常强大，可以对XML实例文档作出细致的语义限制。
- XML Schema不能像DTD一样定义实体，比DTD更复杂，但Xml Schema现在已是w3c组织的标准，它正逐步取代DTD。
XML Schema 文件自身就是一个XML文件，但它的扩展名通常为.xsd。
一个XML Schema文档通常称之为模式文档(约束文档)，遵循这个文档书写的xml文件称之为实例文档。
和XML文件一样，一个XML Schema文档也必须有一个根结点，但这个根结点的名称为Schema。
编写了一个XML Schema约束文档后，通常需要把这个文件中声明的元素绑定到一个ＵＲＩ地址上，在XML Schema技术中有一个专业术语来描述这个过程，即把XML Schema文档声明的元素绑定到一个名称空间上，以后XML文件就可以通过这个URI（即名称空间）来告诉解析引擎，xml文档中编写的元素来自哪里，被谁约束。

<?xml version="1.0" encoding="UTF-8" ?>

<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"

targetNamespace="http://www. gtalent.com"

elementFormDefault="qualified">

<xs:element name='书架' >

<xs:complexType>

<xs:sequence maxOccurs='unbounded' >

<xs:element name='书' >

<xs:complexType>

<xs:sequence>

<xs:element name='书名' type='xs:string' />

<xs:element name='作者' type='xs:string' />

<xs:element name='售价' type='xs:string' />

</xs:sequence>

</xs:complexType>

</xs:element>

</xs:sequence>

</xs:complexType>

</xs:element>

</xs:schema>

<?xml version="1.0" encoding="UTF-8"?>

<gtalent:书架 xmlns:gtalent="http://www. gtalent.com"

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation=“http://www. gtalent.com book.xsd">

<gtalent:书>

<gtalent:书名>Java </gtalent:书名>

<gtalent:作者>xx</gtalent:作者>

<gtalent:售价>30元</gtalent:售价>

</gtalent:书>

</gtalent:书架>

名称空间的概念

在XML Schema中，每个约束模式文档都可以被赋以一个唯一的名称空间，名称空间用一个唯一的URI（Uniform Resource Identifier，统一资源标识符）表示。在Xml文件中书写标签时，可以通过名称空间声明（xmlns），来声明当前编写的标签来自哪个Schema约束文档。如：

<gtalent:书架 xmlns:gtalent=“http://www.gtalent.com”>

<gtalent:书>……</gtalent:书>

</gtalent:书架>

此处使用gtalent来指向声明的名称，以便于后面对名称空间的引用。

注意：名称空间的名字语法容易让人混淆，尽管以 http:// 开始，那个 URL 并不指向一个包含模式定义的文件。事实上，这个 URL：http://www.gtalent.com根本没有指向任何文件，只是一个分配的名字。

为了在一个XML文档中声明它所遵循的Schema文件的具体位置，通常需要在Xml文档中的根结点中使用schemaLocation属性来指定，例如：

<gtalent:书架 xmlns:gtalent="http://www.gtalent.cn"

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation=“http://www.gtalent.com book.xsd">

schemaLocation此属性有两个值。第一个值是需要使用的命名空间。第二个值是供命名空间使用的 XML schema 的位置，两者之间用空格分隔。

注意，在使用schemaLocation属性时，也需要指定该属性来自哪里

使用默认名称空间

基本格式：

xmlns="URI"

举例：

<书架 xmlns="http://www.it315.org/xmlbook/schema"

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation=“http://www.gtalent.com book.xsd">

<书>

<书名>Java </书名>

<作者>xx</作者>

<售价>38.00元</售价>

</书>

<书架>

cheng.kong

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
XML

dom4j-1.6.1.jar链接https://pan.baidu.com/s/1exfHA5d8_hTfRLbkR7yUTg1.申明xml文件<?xml version="1.0" encoding="UTF-8"?>2.申明dtd2.1申明内部dtd<?xml version="1.0" encoding="UTF-8"?><!DO...
复制链接

扫一扫