个人管理后台制作-java爬虫
pom.xml
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.11.2</version>
</dependency>
JSoup 介绍
是一个用于处理HTML的Java库,它提供了一个非常方便类似于使用DOM,CSS和jquery的方法的API来提取和操作数据。
URL加载
//连接url
Document document = Jsoup.connect(url).get();
//等到网页标题 document.title()
System.out.println(document.title());
提取数据
使用DOM方法获取数据
//根据class名称获取dom元素
getElementsByClass(String className)
//通过ID获取元素
getElementById(String id)
元素数据处理
//获取元素属性
attr(String key)