python爬虫怎么爬取图片_怎么用python爬取网站Jpg图片

用python爬取网站图片,通过引用requests库就可完成。下面,小编将以爬取百度图片为例

0cdb2f0e1799e92a0a2d06f4e1fec314f0c5a029.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

工具/原料

python环境,网络

安装requests库

1

cmd打开命令行界面,输入pip install requests,直接安装requests库。安装完成后,可通过pip list命令检查requests库是否安装完成,若显示有requests库,即为成功。

c255efc595ee41c100b2e8e78d88912ca4ca9b29.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

END

批量爬取图片

1

首先,先手动访问百度图片,F12打开开发者工具,选中任一一张图片,右键—检查,会显示图片样式,包括对应链接

a48bc2e8904800fcc862dcbad42043715edb9329.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

2

接着,先试着通过requests获取网页源码,代码如下图:

b87bd38920c5260f41a0993ed2de450789018929.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

3

然后,试着将第一步获取的图片样式的在获取的源码中进行查找,会发现一个问题,代码获取的源码并不完整,因为刚好关于图片数据的这一部分是由JS异步加载的。不过,用图片链接地址进行查找,可以找到,如下图

89402670d5413a8c779de1bb1ffc508c9ace8129.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

4

于是,可以使用re库,正则匹配到图片url,代码如下图

8b3643dd884ce54af4b2a35ba3066b0193ddf729.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

5

最后,就是还是通过requests的get方法,向图片url发送请求,并下载到本地,代码如下图

939c2d40b6f39187e089dd7424fce186252fef29.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

6

完整代码如图

a9338a1fbee434da1ccb0e97f271fe1d97d8e429.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

END

经验内容仅供参考,如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士。

举报作者声明:本篇经验系本人依照真实经历原创,未经许可,谢绝转载。

展开阅读全部

  • 0
    点赞
  • 0
    评论
  • 0
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

表情包
插入表情
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符
©️2021 CSDN 皮肤主题: 数字20 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值