学习用爬虫来提取网络上的图片
- 首先下载htmlparser.jar,(我这里下载的是1.6版本的)下载地址https://mvnrepository.com/artifact/org.htmlparser/htmlparser/1.6,下载完成后导入项目的jar路径里就行。
- 上网找一些爬虫的代码,试着运行看效果,我找的是这个网址的:https://blog.csdn.net/javaxiaojian/article/details/46680297
- 其中把代码中有个小bug,但是只要把把LinkFilter改为Filter就好了。
- 效果的话,还可以,其中过滤器要定义好,不然会爬到一些不想要的照片。