Alex - 用爬虫学习下载图片

最新推荐文章于 2023-06-21 13:17:18 发布

少儿编程侯老师

最新推荐文章于 2023-06-21 13:17:18 发布

阅读量113

点赞数

分类专栏：学生作品 Alex 文章标签： python 正则表达式

更多内容可以联系少儿编程侯老师，微信data_ecology

本文链接：https://blog.csdn.net/houlaos/article/details/104188296

版权

学生作品同时被 2 个专栏收录

815 篇文章 0 订阅

订阅专栏

Alex

17 篇文章 0 订阅

订阅专栏

import os
import requests
import re
# 1.初始参数配置
wenti = input("你想下载什么图片")
# wenti = "袁隆平"
number = 10
# 新建文件夹  make directory
# os.makedirs(wenti)
# 判断是否存在文件夹
if not os.path.exists(wenti):
    os.mkdir(wenti)

# 2.获取网页源代码
url = r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd=1497491098685%5E00_1519X735&word='
url = url+wenti
# print(url)
get = requests.get(url)
# print(get.text)
# 2.1 提取里面的每一个图片链接：正则表达式
tupian_url = re.findall(r'"objURL":"(.*?)", ',get.text)
print(tupian_url)

tupian_shu = 1
for i in tupian_url:
    print("正在下载第%d张图片"%tupian_shu)
    
    tupian_leixing = i.split('.')[-1]
    h = requests.get(i)
    # w write   r read
    f = open("%s/%s_%d.%s"%(wenti,wenti,tupian_shu,tupian_leixing), 'wb')
    f.write(h.content)
    f.close()
    tupian_shu = tupian_shu + 1
    if tupian_shu > number:
        print("已经全部下载完成")
        break