xml学习

最新推荐文章于 2024-09-10 16:26:09 发布

wseeyouagain

最新推荐文章于 2024-09-10 16:26:09 发布

阅读量61

点赞数

分类专栏： XML学习文章标签： xml html python

本文链接：https://blog.csdn.net/wseeyouagain/article/details/120231322

版权

XML学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

xml

一、概念

可扩展标记语言

可扩展：标签都是自定义的

二、功能

存储数据
1. 配置问价
2. 在网络中传输

三、xml与html的区别

xml标签是自定义的，html标签是预定义的。
xml的语法是严格的，html语法是松散的
xml是存储数据的，html是展示数据
- w3c：万维网联盟

四、语法

基本语法：
- xml文档的后缀名.xml
- xml第一行必须定义为文本声明
- xml文档中有且仅有一个根标签
- 属性值必须使用引号（单双引号都可以）引起来
- 标签必须正确关闭
- xml标签名称区分大小写
快速入门

<users>
	<user id="1">
		<name>wang</name>
		<age>12</age>
	</user>
	
	<user id="2">
		<name>zhang</name>
		<age>24</age>
	</user>
</users>

组成部分
1. 文档声明
  - 格式：<?xml 属性列表 ?>
  - 属性列表：
    - version：版本号，必须的属性
    - encoding：编码方式，
    - standalone：是否独立
      - 取值：
        
        yes：不依赖其他文件
        
        no：依赖其他文件
2. 指令：结合css（了解）
3. 标签：标签名称自定义的（规则与java命名规则相似）
4. 属性：id属性值唯一
5. 文本：CDTA区：在该区域中的数据会被原样展示
  - 合适<![CDATA[XXXXXXXXXXXXX]]>
6. 约束：规定xml文档的书写规则
- 作为框架的使用者（程序员）：
  - 能够在xml中引入约束文档
  - 能够简单的读懂约束文档
- 分类：
  - DTD：一种简单的约束技术
  - Schema：一种复杂的约束技术
- DTD
  - 引入dtd文档到xml文档中
    - 内部dtd：将约束规定在xml文档中
    - 外部dtd：将约束的规则定义在外部的dtd文件中
      - 本地<!DOCTYPE 根标签名 SYSTE “dtd文件位置”
      - 网络：
- Schema
  - 填写xml文档的根元素
  - 引入xsi前缀，xmls:xsi=“http://www.w3.org/2001/XMLSchema-instance”
  - 引入xsd文件命名空间，xsi：schemaLocation=“http：//www.xxx.cn/xml student.xsd”
  - 为每一个xsd约束声明一个前缀，作为标识 xmls=“http：//www.xxx.cn/xml”

五、解析

操作xml文档，将文档中的数据读取到内存中

操作xml文档

DOM：将标记语言文档一次性加载到内存，在内存中形成一课dom树
- 优点：操作方便，可以对文档进行CRUD的所有操作
- 缺点：占内存
SAX：逐行读取，基于事件驱动的。
- 优点：不占内存
- 缺点：只能读取，不能增删改
xml常见的解析器：
- JAXP:sun公司提供的解析器，支持dom和sax两种
- DOM4J
- Jsoup
- PULL：安卓操作系统内置的解析器，sax方式

Jsoup

快速入门：

步骤：

导入jar包
.获取Document对象，根据xml文档
获取元素对象ELement

public static void main(String[] args) throws IOException {
        //2.获取Document对象，根据xml文档获取
        //2.1 获取student.xml的path
        String path = JsoupDemo01.class.getClassLoader().getResource("student.xml").getPath();
        //2.2解析xml文档，加载文档进内存，获取dom树
        Document document = Jsoup.parse(new File(path), "utf-8");
        //3获取元素对象ELement
        Elements elements = document.getElementsByTag("name");
        System.out.println(elements.size());
        //3.1获取第一个name的Element对象
        Element element = elements.get(0);
        //3.2获取数据
        String name = element.text();
        System.out.println(name);
    }

对象的使用：
1. Jsoup：工具类，可以解析html或者xml，返回Document
  
  parse：解析html或者xml文档，返回Document
  - parse：(File in,String charsetName) : 解析xml或者html文件的
  - parse：(String html):解析xml或者html字符串
  - parse(URL url, int timeoutMillis) 通过网络路径获取指定的html或xml的文档对象
2. Document：文档对象。代表内存中的dom树
  - getElementsByTag获取所有student对象
  - getElementsByAttribute获取属性名为id的元素对象们
  - getElementsByAttributeValue3获取number属性为heima_0001元素对象
  - getElementById(“1”)获取id属性值元素对象
```
/3.1获取所有student对象
        Elements elements = document.getElementsByTag("student");
        System.out.println(elements);
        System.out.println(".............................");
        //3.2获取属性名为id的元素对象们
        Elements elements1 = document.getElementsByAttribute("id");
        System.out.println(elements1);
        System.out.println("**************************");
        //3.3获取number属性为heima_0001元素对象
        Elements elements2 = document.getElementsByAttributeValue("number", "itcast_0001");
        System.out.println(elements2);
        System.out.println("***************************");
        //3.4获取id属性值元素对象
        Element id = document.getElementById("1");
        System.out.println(id.text());//kiki

        System.out.println(id);
        /*
        <name id="1">
         kiki
        </name>
         */
```
3. Elements：元素Elenent对象的集合。可以当做ArrayList来使用
4. Element：元素对象
  1. 获取子元素对象
    - getElementsByTag获取所有student对象
    - getElementsByAttribute获取属性名为id的元素对象们
    - getElementsByAttributeValue3获取number属性为heima_0001元素对象
    - getElementById(“1”)获取id属性值元素对象
  2. 获取属性值
    - string attr（String key）：根据属性名称获取属性值
  3. 获取文本内容
    - String text（）：获取文本内容
    - String html（）：获取标签体的所有内容（包括字符串内容）
5. Node：节点对象
  - 是Document和Element的父类

wseeyouagain

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
xml学习

xml一、概念可扩展标记语言可扩展：标签都是自定义的二、功能存储数据配置问价在网络中传输三、xml与html的区别xml标签是自定义的，html标签是预定义的。xml的语法是严格的，html语法是松散的xml是存储数据的，html是展示数据w3c：万维网联盟四、语法基本语法：xml文档的后缀名.xmlxml第一行必须定义为文本声明xml文档中有且仅有一个根标签属性值必须使用引号（单双引号都可以）引起来标签必须正确关闭xml标签名称区分大小写
复制链接

扫一扫

专栏目录