爬虫-煎蛋MM图

最新推荐文章于 2021-01-25 16:44:46 发布

PythonKidDz

最新推荐文章于 2021-01-25 16:44:46 发布

阅读量1.3k

点赞数 1

分类专栏：爬虫文章标签：爬虫

本文链接：https://blog.csdn.net/PythonKidDz/article/details/70172507

版权

爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

之前学了用爬虫抓糗百的段子，但是呢，爬段子有什么好爬的，这次我们来学怎么爬MM图，然后自动下载到我们的文件夹中。

先上代码
这里写图片描述

这里主要用到urllib中的urlretrieve()函数，用这个函数将远程数据下载到本地。我们说，之前就说过，上网是为了获取资源，而资源的命名就是通过URL的，因此我们只需要抓取图片的URL，保存到本地就行了。

urlretrieve(url, filename = None, reporthook = None, data = None)
url:资源的url
filename:本地资源路径（绝对路径），即你把资源下载到哪
reporthook:这个是一个回调函数，当连接上服务器、以及相应的数据块传输完毕时会触发该回调，我们可以利用这个回调函数来显示当前的下载进度。
data: 指post到服务器的数据

其他的改动就是正则表达式的匹配模式改一下，我这里的pattern不是很精准，因此用if来辅助我排除不需要的项，把需要的放在imglist列表中。之后就依次下载就行了。这个是简易版的，只爬了一页，比较粗糙。之后会增加点功能，像前面糗百那样

PythonKidDz

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫-煎蛋MM图

之前学了用爬虫抓糗百的段子，但是呢，爬段子有什么好爬的，这次我们来学怎么爬美女图。先上代码这里主要用到urllib中的urlretrieve()函数，用这个函数将远程数据下载到本地。我们说，之前就说过，上网是为了获取资源，而资源的命名就是通过URL的，因此我们只需要抓取图片的URL，保存到本地就行了。urlretrieve(url, filename = None, reporthook =
复制链接

扫一扫

专栏目录