xml语法、xml解析(dom4j)、DTD约束和语法、schema约束和语法

1.xml语法规则

XML文件的后缀名为:xml

文档声明必须是第一行第一列

version:该属性是必须存在的

encoding:该属性不是必须的 打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)

standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no

必须存在一个根标签,有且只能有一个

XML文件中可以定义注释信息

XML文件中可以存在以下特殊字符

&lt; < 小于
&gt; > 大于
&amp; & 和号
&apos; ' 单引号
&quot; " 引号

示例

<?xml version="1.0" encoding="UTF-8" ?>
<!--注释的内容-->
<!--本xml文件用来描述多个学生信息-->
   <students>
      <!--第一个学生信息-->
      <student id="1">
         <name>张三</name>
         <age>23</age>
         <info>学生&lt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;的信息
         </info>
         <message> <![CDATA[内容 <<<<<< >>>>>> ]]]></message>
      </student>
      <!--第二个学生信息-->
      <student id="2">
         <name>李四</name>
         <age>24</age>
      </student>
</students>

2.xml解析

解析思想

DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。 会把 xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值

常见的解析工具 :

JAXP: SUN公司提供的一套XML的解析的API

JDOM: 开源组织提供了一套XML的解析的API-jdom

DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java(我们使用这个进行解析)

pull: 主要应用在Android手机端解析XML 

xml代码:

<?xml version="1.0" encoding="UTF-8" ?>
    <!--注释的内容-->
    <!--本xml文件用来描述多个学生信息-->
    <students>
        <!--第一个学生信息-->
        <student id="1">
            <name>张三</name>
            <age>23</age>
        </student>
        <!--第二个学生信息-->
        <student id="2">
            <name>李四</name>
            <age>24</age>
        </student>
</students>

bean

public class Student {
    private String id;
    private String name;
    private int age;
    public Student() {
    }
    public Student(String id, String name, int age) {
        this.id = id;
        this.name = name;
        this.age = age;
    }
    public String getId() {
        return id;
    }
    public void setId(String id) {
        this.id = id;
    }
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
    public int getAge() {
        return age;
    }
    public void setAge(int age) {
        this.age = age;
    }
    @Override
    public String toString() {
        return "Student{" +
        "id='" + id + '\'' +
        ", name='" + name + '\'' +
        ", age=" + age +
        '}';
    }
}

解析代码:

public class XmlParse {
    public static void main(String[] args) throws DocumentException {
        //1.获取一个解析器对象
        SAXReader saxReader = new SAXReader();
        //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
        Document document = saxReader.read(new
                File("myxml\\xml\\student.xml"));
        //3.获取到根标签
        Element rootElement = document.getRootElement();
        //4.通过根标签来获取student标签
        //elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
        //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集合中并返回
        //List list = rootElement.elements();
        List<Element> studentElements = rootElement.elements("student");
        //System.out.println(list.size());
        //用来装学生对象
        ArrayList<Student> list = new ArrayList<>();
        //5.遍历集合,得到每一个student标签
        for (Element element : studentElements) {
        //element依次表示每一个student标签
        //获取id这个属性
            Attribute attribute = element.attribute("id");
        //获取id的属性值
            String id = attribute.getValue();
        //获取name标签
        //element("标签名"):获取调用者指定的子标签
            Element nameElement = element.element("name");
        //获取这个标签的标签体内容
            String name = nameElement.getText();
        //获取age标签
            Element ageElement = element.element("age");
        //获取age标签的标签体内容
            String age = ageElement.getText();
        // System.out.println(id);
        // System.out.println(name);
        // System.out.println(age);
            Student s = new Student(id,name,Integer.parseInt(age));
            list.add(s);
        }
        //遍历操作
        for (Student student : list) {
            System.out.println(student);
        }
    }
}

3.DTD约束

1. 创建一个文件,这个文件的后缀名为.dtd

2. 看xml文件中使用了哪些元素 可以定义元素

3. 判断元素是简单元素还是复杂元素 简单元素:没有子元素。 复杂元素:有子元素的元素;

代码实现:

<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>

3.1引入DTD约束

1.引入本地DTD约束

// 这是persondtd.dtd文件中的内容,已经提前写好
<!ELEMENT persons (person)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
// 在person1.xml文件中引入persondtd.dtd约束
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons SYSTEM 'persondtd.dtd'>
<persons>
    <person>
        <name>张三</name>
        <age>23</age>
    </person>
</persons>

2.在xml文件内部引入

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons [
        <!ELEMENT persons (person)>
        <!ELEMENT person (name,age)>
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        ]>
<persons>
    <person>
        <name>张三</name>
        <age>23</age>
    </person>
</persons>

3.引入网络dtd

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons PUBLIC "dtd文件的名称" "dtd文档的URL">
<persons>
    <person>
        <name>张三</name>
        <age>23</age>
    </person>
</persons>

4.DTD语法

4.1定义元素

定义一个元素的格式为:

简单元素

EMPTY: 表示标签体为空

ANY: 表示标签体可以为空也可以不为空

PCDATA: 表示该元素的内容部分为字符串

复杂元素

直接写子元素名称. 多个子元素可以使用","或者"|"隔开; ","表示定义子元素的顺 序 ; "|": 表示子元素只能出现任意一个 "?"零次或一次, "+"一次或多次, "*"零次或多次;如果不 写则表示出现一次

 

4.2定义属性

定义一个属性的格式为: 属性的类型: CDATA类型:普通的字符串

属性的约束: // #REQUIRED: 必须的 // #IMPLIED: 属性不是必需的 // #FIXED value:属性值是固定的

<!ELEMENT persons (person+)>
<!ELEMENT person (name,age)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ATTLIST person id CDATA #REQUIRED>
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE persons SYSTEM 'persondtd.dtd'>
<persons>
    <person id="001">
        <name>张三</name>
        <age>23</age>
    </person>
    <person id = "002">
        <name>张三</name>
        <age>23</age>
    </person>
</persons>
```

5.schema约束

5.1schema和dtd的区别

1. schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd

2. 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于 java包名)

3. dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个 数据类型

4. schema 语法更加的复杂

 5.2编写schema约束

步骤

1,创建一个文件,这个文件的后缀名为.xsd。

2,定义文档声明

3,schema文件的根标签 为:

4,在中定义属性: xmlns= http://www.w3.org/2001/XMLSchema

5,在中定义属性 : targetNamespace =唯一的url地址,指定当前这个schema文件的名称空间。 6,在中定义属性 : elementFormDefault="qualified“,表示当前schema文件是一个质量良好的文件。

7,通过 element定义元素

8,判断当前元素是简单元素还是复杂元素

 代码实现:


<?xml version="1.0" encoding="UTF-8" ?>
<schema
xmlns="http://www.w3.org/2001/XMLSchema"
        targetNamespace="http://www.itheima.cn/javase"
        elementFormDefault="qualified"
        >
    <!--定义persons复杂元素-->
    <element name="persons">
        <complexType>
            <sequence>
                <!--定义person复杂元素-->
                <element name = "person">
                    <complexType>
                        <sequence>
                            <!--定义name和age简单元素-->
                            <element name = "name" type = "string">
                            </element>
                            <element name = "age" type = "string">
                            </element>
                        </sequence>
                    </complexType>
                </element>
            </sequence>
        </complexType>
    </element>
</schema>

5.3引入schema约束

步骤

1,在根标签上定义属性xmlns=" http://www.w3.org/2001/XMLSchema-instance "

2,通过 xmlns引入约束文件的名称空间

3,给某一个xmlns属性添加一个标识,用于区分不同的名称 空间 格式为: xmlns:标识=“名称空间地址” ,标识可以是任意的,但是一般取值都是xsi

4,通过 xsi:schemaLocation指定名称空间所对应的约束文件路径 格式为:xsi:schemaLocation = "名称空间url 文件路径“

代码实现

<?xml version="1.0" encoding="UTF-8" ?>
<persons
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
        xmlns="http://www.itheima.cn/javase"
        xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
        >
    <person>
        <name>张三</name>
        <age>23</age>
    </person>
</persons>
        ```

5.4schema约束定义属性

代码示例:

<?xml version="1.0" encoding="UTF-8" ?>
<schema
xmlns="http://www.w3.org/2001/XMLSchema"
        targetNamespace="http://www.itheima.cn/javase"
        elementFormDefault="qualified"
        >
    <!--定义persons复杂元素-->
    <element name="persons">
        <complexType>
            <sequence>
                <!--定义person复杂元素-->
                <element name = "person">
                    <complexType>
                        <sequence>
                            <!--定义name和age简单元素-->
                            <element name = "name" type = "string">
                            </element>
                            <element name = "age" type = "string">
                            </element>
                        </sequence>
                            <!--定义属性,required( 必须的)/optional( 可选的)-->
                        <attribute name="id" type="string"
                                use="required"></attribute>
                    </complexType>
                </element>
            </sequence>
        </complexType>
    </element>
</schema>

<?xml version="1.0" encoding="UTF-8" ?>
<persons
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
        xmlns="http://www.itheima.cn/javase"
        xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
        >
    <person id="001">
        <name>张三</name>
        <age>23</age>
    </person>
</persons>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值