- 三、源代码
使用Java抓包要用到jsoup,来,了解一下。
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
org.jsoup
jsoup
${latest.version}
代码并不多,通过URL地址获取HTML文本内容,并进行解析。
public class JsoupTest {
public static void main(String[] args) throws IOException {
// 要爬取的网址url链接列表
List list = new ArrayList<>();
for (int i = 0; i <= 225; i += 25) {
String url = “https://movie.d