Python 百度爬虫图片

需要 requests 包,需要环境变量的配置


# -*- coding:utf-8 -*-
import re # 导入正则表达式模块,提取网页中所需要的内容
import requests 
import random # 随机生成一个实数,它的取值范围[0,1]


def spiderPic(html,keyword):

    print '正在查找 :' + keyword + ' 对应的图片,正在从百度图片中下载文件 ....'

    for addr in re.findall('"objURL":"(.*?)"',html,re.S):

        print '现在正在爬取URL地址:'+str(addr)[0:50]+"..."

        try:
        
           pics = requests.get(addr,timeout=10) # 请求图像的URL地址(最大时间10s)
        
        except requests.exceptions.ConnectionError:

            print '您当前URL地址请求错误 !'
            continue

        fq = open('C:\\Users\\Administrator\\Desktop\\aa'+(str(random.randrange(0,1000,4))+'.jpg').encode('utf-8'),'wb')
        fq.write(pics.content)
        fq.close()
        
# python 的主方法

if __name__ == '__main__':

    word = raw_input('请输入你想要爬去的图像关键词:')
    
    result = requests.get('http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word='+word)

# 调用函数
spiderPic(result.text,word)


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值