xml文档概念、Jsoup读取xml文档小结

最新推荐文章于 2020-09-02 22:30:32 发布

ZzzzzzP丶

最新推荐文章于 2020-09-02 22:30:32 发布

阅读量205

点赞数

分类专栏： HTML总结文章标签： xml Jsoup

本文链接：https://blog.csdn.net/weixin_43131346/article/details/101075133

版权

xml与html的区别
1. xml标签都是自定义的，html标签是预定义。
2. xml的语法严格，html语法松散
3. xml是存储数据的，html是展示数据
基本语法：
1. xml文档的后缀名 .xml
2. xml第一行必须定义为文档声明<?xml version = '1.0'?>
3. xml文档中有且仅有一个根标签
4. 属性值必须使用引号(单双都可)引起来
5. 标签必须正确关闭
6. xml标签名称区分大小写
操作xml文档
1. 解析(读取)：将文档中的数据读取到内存中
2. 写入：将内存中的数据保存到xml文档中。持久化的存储
- 解析xml的方式：
  1. DOM：将标记语言文档一次性加载进内存，在内存中形成一颗dom树
    - 优点：操作方便，可以对文档进行CRUD的所有操作
    - 缺点：占内存
  2. SAX：逐行读取，基于事件驱动的。
    - 优点：不占内存。
    - 缺点：只能读取，不能增删改

jsoup

对象的使用：
1. Jsoup：工具类，可以解析html或xml文档，返回Document
- parse：解析html或xml文档，返回Document
- parse(File in, String charsetName)：解析xml或html文件的。
- parse(String html)：解析xml或html字符串
- parse(URL url, int timeoutMillis)：通过网络路径获取指定的html或xml的文档对象
1. Document：文档对象。代表内存中的dom树
- 获取Element对象
- getElementById(String id)：根据id属性值获取唯一的element对象
- getElementsByTag(String tagName)：根据标签名称获取元素对象集合
- getElementsByAttribute(String key)：根据属性名称获取元素对象集合
- getElementsByAttributeValue(String key, String value)：根据对应的属性名和属性值获取元素对象集合
1. Elements：元素Element对象的集合。可以当做 ArrayList来使用
2. Element：元素对象
3. 获取子元素对象
  - getElementById(String id)：根据id属性值获取唯一的element对象
  - getElementsByTag(String tagName)：根据标签名称获取元素对象集合
  - getElementsByAttribute(String key)：根据属性名称获取元素对象集合
  - getElementsByAttributeValue(String key, String value)：根据对应的属性名和属性值获取元素对象集合
4. 获取属性值
  - String attr(String key)：根据属性名称获取属性值
5. 获取文本内容
  - String text():获取子标签的纯文本内容
  - String html():获取子标签的所有内容(包括子标签的标签和文本内容)
6. Node：节点对象
  - 是Document和Element的父类
- 快捷查询方式：
  1. selector:选择器
  - 使用的方法：Elements select(String cssQuery)
  - 语法：参考Selector类中定义的语法

最低0.47元/天解锁文章

ZzzzzzP丶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
xml文档概念、Jsoup读取xml文档小结

xml与html的区别xml标签都是自定义的，html标签是预定义。xml的语法严格，html语法松散xml是存储数据的，html是展示数据基本语法：xml文档的后缀名 .xmlxml第一行必须定义为文档声明<?xml version = '1.0'?>xml文档中有且仅有一个根标签属性值必须使用引号(单双都可)引起来标签必须正确关闭xml标签名称区分...
复制链接

扫一扫

专栏目录