python爬虫怎么自动下载图片,【图文详解】python爬虫实战——5分钟做个图片自动下载器...

制作爬虫的基本步骤

一般来说,制作一个爬虫需要分以下几个步骤:

1. 分析需求(对,需求分析非常重要,不要告诉我你老师没教你)

2. 分析网页源代码,配合F12(没有F12那么乱的网页源代码,你想看死我?)

3. 编写正则表达式或者XPath表达式(就是前面说的那个神器)

4. 正式编写python爬虫代码

效果

运行:

恩,让我输入关键词,让我想想,输入什么好呢?好像有点暴露爱好了。

回车

8bd4ef5cf353e172520995250a256277.png

好像开始下载了!好赞!,我看看下载的图片,哇瞬间我感觉我又补充了好多表情包….

fd55a456aac9a7f2a2dd8758b6ece437.png

好了,差不多就是这么个东西。

需求分析

”我想要图片,我又不想上网搜“

”最好还能自动下载”

……

这就是需求,好了,我们开始分析需求,首先,搜索图片,最容易想到的就是爬百度图片的结果,好,那我们就上百度图片看看

6b2c3116cf328587a85519dd34d5d609.png

基本就是这样,还挺漂亮的。

我们试着搜一个东西,我打一个暴字,出来一系列搜索结果,这说明什么….

7de006768e369eb109e67a59296c41a8.png

随便找一个回车

c72a3238474e3d3649ce350a0c3e3707.png

好了,我们已经看到了很多图片了,如果我们能把这里面的图片都爬下来就好了。我们看见网址里有关键词信息

0dd44a4a2e145943a2a9934491ffc883.png

我们试着在网址直接换下关键词,跳转了有没有!

96d45819bb7c35dee239fca6c115f0bc.png

这样,可以通过这个网址查找特定的关键词的图片,所以理论上,我们可以不用打开网页就能搜索特定的图片了。下个问题就是如何实现自动下载,其实利用之前的知识,我们知道可以用request,获取图片的网址,然后把它爬下来,保存成.jpg就行了。

所以这个项目就应该可以完成了。

分析网页

好了,我们开始做下一步,分析网页源代码。这里 我先切换回传统页面,为什么这样做,因为目前百度图片采用的是瀑布流模式,动态加载图片,处理起来很麻烦,传统的翻页界面就好很多了。

这里还一个技巧,就是:能爬手机版就不要爬电脑版,因为手机版的代码很清晰,很容易获取需要的内容。

好了,切换回传统版本了,还是有页码的看的舒服。

5af9e649a793936bae567e9d547deb7a.png

我们点击右键,查看源代码

b430c75d6cd8fc8f9544131d087af6e5.png

这都是什么鬼,怎么可能看清!!

91d1d45ade9a6b94fda06f1f6b18b93b.png

这个时候,就要用F12了,开发者工具!我们回到上一页面,按F12,出来下面这个工具栏,我们需要用的就是左上角那个东西,一个是鼠标跟随,一个是切换手机版本,都对我们很有用。我们这里用第一个

ac1bab1e3daf59d4bfed72f786ace4fa.png

然后选择你想看源代码的地方,就可以发现,下面的代码区自动定位到了这个位置,是不是很NB!

f1300dd796a045df0cfe7c813ee51e2b.png

我们复制这个地址

然后到刚才的乱七八糟的源代码里搜索一下,发现它的位置了!(小样!我还找不到你!)但是这里我们又疑惑了,这个图片怎么有这么多地址,到底用哪个呢?我们可以看到有thumbURL,middleURL,hoverURL,objURL

084181ab286dc76d09f035e4cdc077bc.png

相关报道:

php json_encode与json_encode的方法 一、json_encode() 该函数主要用来将数组和对象,转换为json格式。先看一个数组转换的例 更多

很多seoer在做站前,最害怕百度看不上。也就是百度考核期。主要是百度不收录你的页面、没有索引量。一般考核期在1-3个月,那我们该如何快速的融入百度家族,下面小女就跟大家分享一下关于百度考核期seoer该注意哪些问题。 1、网站是否是一个稳定的空间 一个 更多

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值