学习笔记:XML

XML

XML概述

XML,是一种可扩展的标记语言,标记语言:通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)
可拓展:标签的名字是可以自定义的
可理解为:XML文件是由很多标签组成的,而标签名是可以自定义的
作用:
  1. 用于进行存储数据和传输数据
  2. 作为软件的配置文件

A系统--------------------->B系统

​ (XML文件)

A系统<---------------------A系统

XML标签

  1. 标签由一对尖括号和合法标识符组成
  2. 标签必须成对出现 (开始标签) (结束标签)
  3. 特殊的标签可以不成对,但是必须由结束标记
  4. 标签中可以定义属性,属性和标签名空格隔开
    属性值必须用引号引起来
  5. 标签需要正确的嵌套

    ​ 张三

XML语法规则

  1. XML文件后缀名为:xml
  2. 文档声明必须是第一行第一列
    <?xml version= "1.0" encoding="UTF-8" standalone= "yes" ?>

    version : 该属性是必须存在的

    encoding : 该属性不是必须的

    ​ 打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)

    standalone : 该属性不是必须的,描述XML文件是否依赖其他的XML文件,取值为 yes/no

  3. 必须存在一个根标签,有且只能有一个
  4. XML文件中可以定义注释信息
  5. XML文件中可以存在以下特殊字符 [大于 小于 和号 单引号 引号]
  6. XML文件中可以存在CDATA区

    <![CDATA[...内容...]]>

解析XML

DOM解析思想

DOM文档对象模型:就是把文档的各个组成部分看做成对应的对象。

会把xml文件全部加载到内存。

[获取Document对象(整个xml文档对象)
-------->{Element对象(所有标签)------->Attribute对象(所有属性)-------->Text对象(所有文本内容)}(共同的父类Node对象)]

在内存中形成一个树形结构,再获取对应的值

<?xml version="1.0" encoding="utf-8" ?>
<!--注释的内容-->
<!--本XML文件用来描述多个学生信息-->
<students>
    <!--第一个学生信息-->
    <student id="1">
        <name>张三</name>
        <age>23</age>
        <info>学生&lt; &gt;</info> 
        <message><![CDATA[内容<<<<<>>>>>]]></message>
    </student>

    <!--第二个学生信息-->
    <student id="2">
        <name>李四</name>
        <age>24</age>
    </student>

    <aaa></aaa>
</students>
package XMLparse;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

import java.io.File;
import java.util.ArrayList;
import java.util.List;

/**
 * 利用dom4j解析xml文件
 */
public class xmlParse {
    public static void main(String[] args) throws DocumentException {
        //1.获取解析器对象
        SAXReader saxReader = new SAXReader();
        //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
        Document document = saxReader.read(new File("D:\\java学习04\\.idea\\xml\\student.xml"));
        //3.获取到根标签
        Element rootElement = document.getRootElement();
        //4.通过根标签来获取student标签
        //elements():可以获取调用者所有的子标签,会把子标签放到一个集合中返回
        //elements("标签名"):可以获取调用者所有指定的子标签,会把这些子标签放到一个集合中并返回

        //List list = rootElement.elements();
        List<Element> studentElements = rootElement.elements("student");
        //System.out.println(list.size());

        //用来装学生对象
        ArrayList<Student> list = new ArrayList<Student>();

        //5.遍历集合,得到每一个student标签
        for (Element element : studentElements) {
            //element依次表示每一个student标签

            //获取id这个属性
            Attribute attribute = element.attribute("id");
            //获取id这个属性值
            String id = attribute.getValue();

            //获取name标签
            //element("标签名"): 获取调用者指定的子标签
            Element nameElement = element.element("name");
            //获取这个标签的标签体内容
            String name = nameElement.getText();

            //获取age标签
            Element ageElement = element.element("age");
            String age = ageElement.getText();

//            System.out.println(id);
//            System.out.println(name);
//            System.out.println(age);

            Student s = new Student(id,name,Integer.parseInt(age));
            list.add(s);


        }

        for (Student student : list) {
            System.out.println(student);
        }

    }
}

XML文档约束

约束:用来限定xml文件中可使用的标签以及属性(告诉程序员,xml该怎么写)
约束的分类:DTD schema

DTD约束

  1. 能在xml中引入约束文档
    1.1 引入本地dtd
    <!DOCTYPE 根元素名称 SYSTEM 'DTD文件的路径'>
    
    <?xml version="1.0" encoding="UTF-8" ?>
    <!DOCTYPE persons SYSTEM 'persondtd.dtd'>
    
    <persons>
        <person>
            <name>张三</name>
            <age>23</age>
        </person>
    
    </persons>
    
    1.2 再xml文件内部引入
    <!DOCTYPE 根元素名称 [dtd文件内容]>
    
    <?xml version="1.0" encoding="UTF-8" ?>
    <!DOCTYPE persons[
            <!ELEMENT persons (person)>
            <!ELEMENT person (name,age)>
            <!ELEMENT name (#PCDATA)>
            <!ELEMENT age (#PCDATA)>
            ]>
    
    <persons>
        <person>
            <name>张三</name>
            <age>23</age>
        </person>
    </persons>
    
    1.3 引入网络dtd
    <!DOCTYPE persons PUBLIC "dtd文件的名称" "dtd文档的URL">
    
  2. 能够简单阅读约束文档
  3. 根据约束编写xml文件

DTD语法规则

定义一个元素的格式为:<!ELEMENT 元素名 元素类型>

简单元素:

EMPTY:表示标签体为空

ANY:表示标签体可以为空也可以不为空

PCDATA:表示该元素的内容部分为字符串

复杂元素:

直接写子元素名称。

​ 多个子元素可以使用"," 或者"|"隔开; "?"零次或一次

​ “,” 表示定义子元素的顺序; --------------------------> "+"一次或多次

​ “|” 表示子元素只能出现任意一个 "*"零次或多次 (如果不写则表示出现一次)

定义一个属性的格式为:<!ATTLIST 元素名称 属性名称 属性的类型 属性的约束>

属性的类型: CDATA类型:普通的字符串

属性的约束:

#REQUIRED :必须的

#IMPLIED :属性是不必须的

#FIXED value :属性值是固定的

schema约束

  1. schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名 .xsd

  2. 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于java包名)

  3. dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是再schema里面可以支持很多个数据类型

  4. schema语法更加的复杂

    schema文件用来约束一个xml文件同时也被别的文件约束着
    定义属性
    <attribute name="id" type="string" use="required"></attribute>
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序猿小张的日常笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值