JavaWeb学习笔记（二十四）-CSDN博客

本文链接：https://blog.csdn.net/a2606838392/article/details/120172705

XML

概念：可扩展标记语言。
- 可扩展：标签自定义。
功能：存储数据。作为配置文件在网络中传输
与HTML的区别：
1. xml的标签是自定义的，html的标签是预定义的
2. xml的语法严格，html语法松散
3. xml是存储数据的，html是展示数据的

语法：
1. 基本语法
  1. xml文档的后缀名：.xml
  2. xml第一行必须定义为文档声明
  3. xml文档中，有且仅有一个根标签
  4. 属性值必须使用引号包裹
  5. 标签必须有结束标签。除非是自闭和标签
  6. xml标签名称区分大小写
2. 快速入门
3. 组成部分
  1. 文档声明
    1. 格式：<?xml 属性列表?>
    2. 属性列表：
      - version：版本号，必须属性
      - encoding：编码格式。告知解析引擎当前文档使用的字符集。默认值：ISO-8859-1
      - standalone：是否独立。取值为yes或no，即是否依赖其他文件
  2. 指令：结合CSS
  3. 标签：标签名称自定义。数字不能开头
  4. 属性：id属性值唯一
  5. 文本内容：
    1. CDATA区：在该区域中的数据会被原样展示
      1. 格式：<![CDATA][数据]>
4. 约束：由框架（软件）提供，规定xml文档的书写规则，程序员（用户）阅读
  - 分类
    1. DTD：一种简单的约束技术
    2. Schema：一种复杂的约束技术
  - DTD：
    - 引入DTD文档到xml文档中
      - 内部DTD：将约束规则定义在xml中
      - 外部DTD：将约束规则定义在外部的dtd文件中
        本地：
        网络：
  - Schema：
    - 引入：
      1. 填写xml文档的根元素
      2. 引入xsi前缀。xmln：xsi = “http://www.w3.org/2001/XMLSchema-instance”
      3. 引入xsd文件命名空间。xsi：schemaLocation=“http://www.itcast.cn.xml student.xsd”
      4. 为每一个xsd约束声明一个前缀，作为标识 xmlns=“http://www.itcast.cn/xml”
    - 解析：操作xml文档，将文档中的数据读取到内存中
      1. 操作xml文档
        解析（读取）:将文档的数据读取到内存中。
        写入：将内存中的数据保存到xml文档中。持久化的存储
      2. 解析xml的方式：
        DOM：将标记语言文档一次性加载进内存，在内存中形成一颗DOM树
        优点：操作方便，可以对文档进行CRUD的所有操作
        缺点：DOM树较为消耗内存
        
        SAX：逐行读取，基于事件驱动
        优点：不占内存
        缺点：只能读取，不能增删改
      3. xml常见的解析器：
        JAXP：SUN公司提供的解析器，支持DOM和SAX两种思想
        DOM4J：一款非常优秀的解析器
        Jsoup：可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
        PULL：Android操作系统内置的解析器，sax方式的
    - Jsoup：
      - 快速入门：
        步骤：
        导入jar包
        获取document对象
        获取对应的标签Element对象
        获取数据
    - 对象的使用：
      - Jsoup：工具类，可以解析html或xml文档，返回Document
        parse（）：
        该方法有很多重载。可解析xml或html文件的
        解析xml或html字符串
        通过网络路径获取指定的html或xml的文档对象
      - Document：文档对象，代表内存中的dom树
        获取Element对象，用get方法
      - Elements：元素Element对象的集合。可以当作ArrayList《Element》来使用
      - Element：元素对象
        获取子元素对象，用get方法
        获取属性值：String attr（String key）：根据属性名称获取属性值
        获取文本内容：String text（）：获取文本内容。String html（）获取标签体所有内容（包括子标签的字符串内容）
      - Node：节点对象，是Document和Element的父类