Alex - 用爬虫学习下载图片

import os
import requests
import re
# 1.初始参数配置
wenti = input("你想下载什么图片")
# wenti = "袁隆平"
number = 10
# 新建文件夹  make directory
# os.makedirs(wenti)
# 判断是否存在文件夹
if not os.path.exists(wenti):
    os.mkdir(wenti)

# 2.获取网页源代码
url = r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd=1497491098685%5E00_1519X735&word='
url = url+wenti
# print(url)
get = requests.get(url)
# print(get.text)
# 2.1 提取里面的每一个图片链接:正则表达式
tupian_url = re.findall(r'"objURL":"(.*?)", ',get.text)
print(tupian_url)

tupian_shu = 1
for i in tupian_url:
    print("正在下载第%d张图片"%tupian_shu)
    
    tupian_leixing = i.split('.')[-1]
    h = requests.get(i)
    # w write   r read
    f = open("%s/%s_%d.%s"%(wenti,wenti,tupian_shu,tupian_leixing), 'wb')
    f.write(h.content)
    f.close()
    tupian_shu = tupian_shu + 1
    if tupian_shu > number:
        print("已经全部下载完成")
        break




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值