jsoup 是一款 Java 的 HTML 解析器,可直接解析HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。
jsoup API文档:http://tool.oschina.net/apidocs/apidoc?api=jsoup-1.6.3
jsoup的作用:
1、可以根据URL、本地文件和字符串解析HTML的内容
2、可以使用DOM、JQuery选择器来查找获取元素
3、可以操作元素、文本、属性
maven依赖:
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.8.3