32、XML

XML

概念:可扩展标记语言,标签都是自定义

功能:存储数据

            1、配置文件

            2、在网络中传输

XML和HTML的区别:1、xml标签都是自定义的,html标签都是预定义的

                              2、xml的语法严格,html语法松散

                              3、xml是存储数据的,html是展示数据的

 

语法:1、xml文档的后缀名 .xml

         2、xml第一行必须定义为文档声明 <? xml version = '1.0' ?>

         3、xml文档中有且仅有一个根标签

         4、属性值必须使用引号(单双都可)引起来

         5、标签必须正确关闭

         6、xml标签名称区分大小写

 

组成部分:1、文档声明

                        格式:<? xml 属性列表 ?>

                        属性列表:version:版本号,必须属性

                                       encoding:编码方式,告知解析引擎当前文档使用的字符集,默认值:ISO-8859-1

                                       standalone:是否独立,取值yes , no

               2、指令

                        结合css

               3、标签

                        标签名称自定义规则:1、名称可以包含字母、数字以及其他的字符

                                                      2、名称不能以数字或者标点符号开始

                                                      3、名称不能以字母xml(Xml,Xml等等)开始

                                                      4、名称不能包含空格

               4、属性

                        id属性值唯一

               5、文本

                        CDATA区:在该区域中的数据会被原样展示

                        格式:<![CDATA][ 数据 ]>

 

XML的约束:规定xml文档的书写规则

分类:DTD:一种简单的约束技术

         Schema:一种复杂的约束技术

DTD:引入dtd文档到xml文档中

          内部dtd:将约束规则定义在xml文档中

                        <! DOCTYPE  根标签名 [约束内容]>

          外部dtd:将约束的规则定义在外部的dtd文件中

                        本地:<! DOCTYPE 根标签名 SYSTEM “dtd文件的位置”>

                        网络:<! DOCTYPE 根标签名 PUBLIC “dtd文件名字”“dtd文件的位置URL”>

Schema:

        引入:1、填写xml文档的根目录

                 2、引入xsi前缀

                 3、引入xsd文件的命名空间

                 4、为每个xsd约束声明一个前缀

 

XML的解析:

          读取:将文档中的数据读取到内存中

          写入:将内存中的数据保存到xml文档中,持久化存储

         

         方式:

                    1、DOM:将标记语言文档一次性加载进内存,在内存中形成一棵DOM树

                            优点:操作方便,可以对文档进行CRUD的所有操作

                            缺点:占内存

                    2、SAX:逐行读取,基于事件驱动

                            优点:不占内存

                            缺点:只能读取,不能增删改

xml常见的解析器:

                1、JAXP:sun公司提供的解析器,支持dom和sax思想

                2、DOM4J:一款非常优秀的解析器

                3、Jsoup:Java的HTML解析器

                4、PULL:安卓操作系统内置的解析器,sax方式

Jsoup:

     使用步骤:1、导入jar包

                    2、获取document对象

                    3、获取对应标签的Element 对象

                    4、获取数据

     对象的使用:1、Jsoup:工具类,可以解析html或xml文档,返回Document

                                  方法:parse:解析html或xml文档,返回Document

                                           parse(File in,string charsetName):解析xml或html文件的

                                            parse(String html):解析xml或html字符串

                                           parse(URL url,int timeoutMillis):通过网络路径获取指定的html或xml的文档对象

                        2、Document:

                                    1、获取Element:

                                    getElementById(String id):根据id属性值获取唯一的element对象

                                    getElementsByTag(String tagName):根据标签名称获取元素对象集合

                                    getElementsByAttribute(String key):根据属性名称获取元素对象集合

                                    getElementsByAttributeValue(String key,String Value):根据属性名称和属性值获取元素对象集合

                         3、Element:

                                    1、获取子元素对象          

                                    getElementById(String id):根据id属性值获取唯一的element对象

                                    getElementsByTag(String tagName):根据标签名称获取元素对象集合

                                    getElementsByAttribute(String key):根据属性名称获取元素对象集合

                                    getElementsByAttributeValue(String key,String Value):根据属性名称和属性值获取元素对象集合

                                    2、获取属性值

                                    String attr(String key):根据属性名称获取属性值

                                    3、获取文本内容

                                    String text():获取文本内容

                                    String html():获取标签体的所以内容

                            5、Node:节点对象

 

快捷查询方式:

             1、selector:选择器

                        Element select(String cssQuery)

             2、XPath:  

                        使用Jsoup的XPath需要额外导入jar包                                       

转载于:https://my.oschina.net/u/4131739/blog/3065558

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值