概念
对xml/html进行解析(html 是 xml 的子集),一种第三方工具,解析效率大大提高
使用
pom.xml
<!-- xml/html文件获取 -->
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.13.1</version>
</dependency>
一系列操作
获取文档
- 字符串获取
- 文件file获取
- URL获取
获取元素
- 通过id
- 通过标签
- 通过类名称
- 通过属性
获取内容
选择器语法
在选择元素的时候,除了使用方法名如 getElementById 这样的外,还可以用 选择器语法来选择
操作起来就像 jquery了,比如 getElementById 就可以写成是 select(“#id”)
修改操作
jsoup 除了可以解析 html/xml 外,还可以进行修改操作