前置说明
虽然可以爬取数据,但是不能获取网页的视频(tika包可以)、音乐、Ajax数据,只能获取页面渲染出的元素和数据。必须联网。
1、引入maven包
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.14.3</version>
</dependency>
2、链接网页及抓取代码
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.js