xml基本用法

dmhxm

已于 2022-01-20 18:25:21 修改

阅读量194

点赞数

分类专栏：笔记文章标签： xml

于 2022-01-19 15:07:50 首次发布

本文链接：https://blog.csdn.net/weixin_44079370/article/details/122581029

版权

笔记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1. 概念

Extensible Markup Language 可扩展标记语言
可扩展：标签都是可以自定义的。例：

功能：
存储数据
配置文件、在网络中传输
xml与html的区别
xml标签都是自定义的，html标签是预定义
xml语法严格，html语法松散
xml是存储数据的，html是展示数据

2. 语法

xml文档的后缀名：.xml
xml第一行必须定义为文档声明
xml文档中有且仅有一个根标签
属性值必须使用引号引起来
xml标签名称区分大小写

3. 组成部分

文档声明
- 格式：<?xml 属性列表 ?>
- 属性列表：
  - version：版本号，必须的属性，常用的就是1.0
  - encoding：编码方式，告知解析引擎当前文档使用的字符集，默认值：ISO-8859-1
  - standalone：是否独立
    - 取值：yes：不依赖其他文件 no：依赖其他文件
- 指令：结合css
  - <?xml-stylesheet type="text/css" href="a.css" ?>
- 标签：标签名称自定义
  - 规则：
    - 名称可以包含字母、数字以及其他的字符
    - 名称不能以数字或者标点符号开始
    - 名称不能以字母xml（或者XML、xmL等等）开始
    - 名称不能包含空格
- 属性：
  - id属性值唯一
- 文本
  - CDATA区：在该区域中的数据会被原样展示
    - 格式：<![CDATA[数据]]>

4. 约束

分类
- DTD：一种简单的约束技术
- Schema：一种复杂的约束技术
DTD：
- 引入dtd文档到xml文档中
  - 内部dtd：将约束规则定义在xml文档中
  - 外部dtd：将约束的规则定义在外部的dtd文件中
    - 本地：
    - 网络：
SCHEMA
- 引入：
  - 填写在xml文档的根元素
  - 引入xsi前缀 xmlns:xsi=“http://www.w3.org/2001/XMLSchema-instance”
  - 引入xsd文件命名空间 xsi:schemaLocation=“http://www.itcast.cn/xml student.xsd”
  - 为每一个xsd约束声明一个前缀，作为表示 xmlns=“http://www.itcast.cn/xml”

5. 解析

操作xml文档，将文档中的数据读取到内存中
- 解析（读取）：将文档中的数据读取到内存中
- 写入：将内存中的数据保存到xml文档中。持久化存储
- 解析xml的方式：
  - DOM：将标记语言文档一次性加载进内存，在内存中行程一颗dom树
    - 优点：操作方便，可以对文档进行CRUD（增删改查）的所有操作
    - 缺点：比较占内存
  - SAX：逐行读取，基于事件驱动
    - 优点：基本不占内存
    - 缺点：只能读取，不能增删改
- xml常见的解析器：
  - JAXP：sun公司提供的解析器，支持dom和sax两种思想
  - DOM4J：基于dom思想
  - Jsoup：jsoup 是一款 Java 的 HTML 解析器，可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API，可通过 DOM、CSS 以及类似于 JQuery 的操作方法来取出和操作数据
  - PULL：Android操作系统内置的解析器，sax方式的
- Jsoup的使用方式：
  - 步骤：
    - 导入jar包
    - 获取DOcument对象
    - 获取对应的标签Element对象
    - 获取数据

    public static void main(String[] args) throws IOException {
        // 获取user.xml的path
        String path = Objects.requireNonNull(JsoupDemo.class.getClassLoader().getResource("user.xml")).getPath();
        // 解析xml文档，加载文档进内存，获取dom树--> Document对象
        Document document = Jsoup.parse(new File(path), "utf-8");
        // 获取元素对象 Element
        Elements elements = document.getElementsByAttributeValue("id", "001");
        System.out.println(elements);
    }

对象的使用：
- Jsoup：工具类，可以解析html或xml文档，返回Document
  - parse：解析html或xml文档，返回Document
    - parse(File in, String charsetName)：解析xml或者html文件
    - parse(String html)：解析xml或html字符串
    - parse(URL url, int timeoutMillis)：通过网络路径获取指定的html或者xml的文档对象
  - Document：文档对象，代表内存中的dom树
    - 获取Element对象
      - getElementById(String id)：根据id属性值获取唯一的element对象
      - getElementByTag(String tagName)：根据标签名称获取元素对象集合
      - getElementByAttribute(String key)：根据属性名称获取元素对象集合
      - getElementByAttributeValue(String key, String value)：根据属性名称和属性值获取元素对象集合
  - Elements：元素Element对象的集合，可以当做ArrayList来使用
  - Element：元素对象
    - 获取子元素对象
      - getElementById(String id)：根据id属性值获取唯一的element对象
      - getElementByTag(String tagName)：根据标签名称获取元素对象集合
      - getElementByAttribute(String key)：根据属性名称获取元素对象集合
      - getElementByAttributeValue(String key, String value)：根据属性名称和属性值获取元素对象集合
    - 获取属性值
      - String attr(String key)：根据属性名称获取值
    - 获取文本内容
      - String text()：获取文本内容
      - String html()：获取标签体的所有内容（包含子标签的字符串内容）
  - Node：节点对象
快捷查询方式：
- selector：选择器
  - 使用的方法：Elements select(String cssQuery)
    - 语法：参考selector类中定义的预发
XPath：XPath即为XML路径语言，它是一种用来确定XML（标记通用标记语言的子集）文档中某部分位置的语言
- 使用Jsoup的Xpath需要额外导入jar包
- 查询w3cshool参考手册，使用XPath的语法完成查询

dmhxm

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
xml基本用法

1. 概念Extensible Markup Language 可扩展标记语言可扩展：标签都是可以自定义的。例：功能：存储数据配置文件、在网络中传输xml与html的区别xml标签都是自定义的，html标签是预定义xml语法严格，html语法松散xml是存储数据的，html是展示数据2. 语法xml文档的后缀名：.xmlxml第一行必须定义为文档声明xml文档中有且仅有一个根标签属性值必须使用引号引起来xml标签名称区分大小写3. 组成部分文档声明格式：&
复制链接

扫一扫