网络爬虫系列
python网络爬虫(一) 爬取网站图片
python网络爬虫(二)分页爬取图片
上篇回顾
- 在上篇讲述了网络爬虫爬取某个网页上的图片,我们实现的是具有Img标签的所有href进行爬取。但是,一个网站不可能只有一个页面有图片,我们爬取图片也不是只爬取一个页面的图片,这时如果我们需要爬取某个网站上的多页图片时,就需要对上篇代码进行改进了。
怎么实现分页爬取呢?
- 还是以ZOL桌面壁纸这个网站为例,打开网站我们发现下面有上一页、1、2、3、4、5、下一页等链接可以点击,所以在改进代码时,就是对这几个链接左处理了。
- 当我们点击每页时可以找到URL的一些规律: