【python爬虫】爬取你想要的图片

这个爬虫的作用就是:输入你想要爬的图片的名称,然后自动通过百度图片爬取保存在本地文件夹中  

需要用到的模块:re(正则表达式),request,random  


#!-*- coding:utf-8 -*-  
#FileName : img.py  
#Author : CSDN_fzs  
#Data : 2018/01/10  
import re #导入正则表达式模块  
import requests #python HTTP客户端 编写爬虫和测试服务器经常用到的模块  
import random #随机生成一个数,范围[0,1]  
#定义函数方法  
def spiderPic(html,keyword):  
    print('正在查找 ' + keyword +' 对应的图片,下载中,请稍后......')  
    for addr in re.findall('"objURL":"(.*?)"',html,re.S):     #查找URL  
        print('正在爬取URL地址:'+str(addr)[0:30]+'...')  #爬取的地址长度超过30时,用'...'代替后面的内容  
        try:  
            pics = requests.get(addr,timeout=10)  #请求URL时间(最大10秒)  
        except requests.exceptions.ConnectionError:  
            print('您当前请求的URL地址出现错误')  
            continue  
        fq = open('D:\\img\\' + (keyword+'_'+str(random.randrange(0,1000,4))+'.jpg'),'wb')     #下载图片,并保存和命名  
        fq.write(pics.content)  
        fq.close()  

#python的主方法  
if __name__ == '__main__':  
    word = input('请输入你要搜索的图片关键字:')  
    result = requests.get('http://image.baidu.com/search/index?tn=baiduimage&ps=1&ct=201326592&lm=-1&cl=2&nc=1&ie=utf-8&word=' + word)  


#调用函数  
spiderPic(result.text,word)  


"word"的作用就是接收你想要找的图片名称,然后拼接到“百度图片”的链接上

查看谷歌浏览器搜索栏百度图片“汽车”的链接

2417802-8317deb509a1b2d4.png

查看代码执行结果

2417802-0dbe55bcff094767.png

抓取的图片自动保存在本地文件夹并自动命名

2417802-3850ff7ec4958d04.png
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

狮子王量化

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值