准备工作
- 去maven仓库下载jsoup的jar包或者在maven工程添加依赖
<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup -->
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.13.1</version>
</dependency>
- 去找王者荣耀网址爬取英雄图片
https://pvp.qq.com/web201605/herolist.shtml
-
打开开发者工具(右键检查),找到Elements定位到图片的区域
-
通过Jsoup类中静态方法connect()连接网址https://pvp.qq.com/web201605/herolist.shtml
-
通过Connection对象获取Document对象(即文档对象)
-
通过Document对象获取标签Elements对象
-
遍历所有的li标签,得到该英雄的图片地址
-
通过获取所有得到的新地址,再通过定位得到图片对应的jpg格式
-
通过输入输出流将图片读取到本地
代码
public class TestMain {
public static void crawlingPictures()