Java:XML标记语言

XML

称为可扩展的标记语言,允许使用标记和子标记方式描述对象数据。

XML的声明

XML申明是XML文档的第一行,用于指定文档的版本和编码集,语法:

<?xml version="1.0" encoding="UTF-8" ?>

XML的注释

XML注释用于说明某一个标签或内容的含义。编译时会忽略,语法:

XML的元素

XML元素是存储数据的单元,元素应该成对出现

如果元素中没有内容,应该以空标记描述

------

XML的根元素

根元素是一个完全包括文档中其它所有元素的元素。所有元素都必须在根元素中定义,一个XML文档有且只有一个根元素

XML标记的属性

XML标记的属性用于描述标记的特征。属性必须定义在标记中,必须以单引或双引包裹。同一个标记中,属性不能同名,属性和属性之间以空格隔开。

XML实体

在XML中预定义的符号如:<、‘’、>,如果XML文本中出现了这样的数据,可以使用预定义的实体来代替

&It;-------- <

&gt;-------- >

&amp;----- &

&quot;------ ”

&apos;------- ’

CDATA标记

由于XML实体阅读起来很不直观,我们可以用CDATA标记代替。CDATA标记中的内容,XML解释器都当文本处理,标记不会被展开。

语法:

<![CDATA[   

价格 <、>、‘、“丰田 

 ]]>

XML语法规则

格式良好的XML文档:

满足XML语法规则的XML文档,称为格式良好的XML。格式良好的XML,才能正确被XML解析器和应用程序解析。

1、必须要有XML文档声明

2、有且只有一个根元素

3、标记区分大小写

4、标记要成对出现

5、属性要加引号

6、空标记要关闭

7、元素要正确嵌套

XML文档的校验技术

格式良好的XML,满足XML的语法规则,但是XML文档中的标记、属性、以及标记的嵌套关系无法描述。

DTD和Schema都是用于定义XML结构,并且用于校验我们书写的XML文档是否符合要求的技术

<?xml version="1.0" encoding="GB2312" ?>
<!DOCTYPE 家庭 [         DOCTYPE 表示定义根元素为”家庭“
 <!ELEMENT 家庭 (+,家电*)>  ELEMENT 用于定义元素。家庭(+,家电*)表示家庭元素中有两个子元素:人和家电。其中人子元素出现一次或多次,而家电元素出现零次或多次。
 <!ELEMENT 人 (#PCDATA)> #PCDATA表示在人元素中的内容,为文本
 <!ELEMENT 家电 EMPTY> EMPTY 表示家电元素为空标记
 <!ATTLIST 人 ATTLIST表示给指定元素定义属性
  名字 CDATA #REQUIRED CDATA表示该属性内容为文本。#REQUIRED表示该属性必须书写
  性别 (|) #REQUIRED 性别属性只能是男或女
  爱好 CDATA #IMPLIED   #IMPLIED表示该属性可有可无
 >
 <!ATTLIST 家电
   名称 CDATA #REQUIRED
   说明 CDATA #IMPLIED
 >
]> 

有效的XML文档:有效的XML文档。除了要满足XML语法规则以外,还必须满足对应DTD或Schema描述元素规则。

有效的XML文档,一定是格式良好的XML文档。但格式良好的XML文档,不一定有效

XML的解析技术

XML文档内容,需要读取到内存中,才能被应用程序所识别。对于标记、子标记,以及标记属性数据的提取,称为XML解析。

XML解析技术有两种:DOM解析和SAX解析

DOM解析特点:

1、基于树状结构的API

2、将整个XML文档内容,读取到内存,进行解析和存储

3、可以随机访问XML文档的内容

4、大型文档可能造成内存紧张

SAX解析特点:

1、不必将整个文件加载到内存中,占用的内存少

2、不能随机访问XML文档内容

3、文档只能遍历一次

4、SAX只能读取,不能写入

DOM解析和SAX解析各有优缺点,在开发种,通常使用第三方进行XML的解析。从而简化解析的过程。常用的有:JDOM和DOM4J

解析流程:

   public List<Student> getList() {
        List studentList = new ArrayList<>();
        SAXReader sax = new SAXReader();
        try {
            //读取XML文档,将读取信息存放到document对象中
            Document doc = sax.read("src/main/java/com/lovo/xml/txt/lovoClass.xml");

            //选择一个节点,一个student标记就是一个Node对象
            List<Element> elementList = doc.selectNodes("/lovoClass/student");
            for (Element em : elementList) {
                Student s = new Student();
                //将student标签中的code属性取出,封装为学生对象的code属性
                s.setCode(Integer.valueOf(em.attributeValue("code")));
                s.setPhone(em.attributeValue("tel"));
                //将student标签的子元素name中间的文本取出,封装为学生对象的name属性
                s.setName(em.elementText("name"));
                s.setEdu(em.elementText("edu"));
                s.setAge(Integer.valueOf(em.elementText("age")));
//                System.out.println(s);
                studentList.add(s);
            }

        } catch (Exception e) {
            e.printStackTrace();
        }
        return studentList;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值