【python】通过链接批量下载图片

解决的问题:图片的链接存储在xlsx文件的第二列,xlsx的第一列存储的图片的名称,要求读取文件的名称和链接,并给图片命名为xxx-i这种形式。

import pandas as pd
import requests
import os

# 读取Excel文件
file_path = '读取文件的路径'  # 替换为你的Excel文件路径
df = pd.read_excel(file_path)

# 保存图片的文件夹
save_folder = '保存图片的文件夹'
os.makedirs(save_folder, exist_ok=True)

# 遍历Excel文件中的每一行
for index, row in df.iterrows():
    prefix = row[0]
    image_urls = eval(row[1])  # 假设链接是以字符串形式保存的列表,需要用eval转换

    for i, url in enumerate(image_urls, start=1):
        try:
            response = requests.get(url)
            response.raise_for_status()  # 检查请求是否成功
            ext = url.split('.')[-1]  # 获取图片扩展名
            image_name = f'{prefix}-{i}.{ext}'
            image_path = os.path.join(save_folder, image_name)

            with open(image_path, 'wb') as file:
                file.write(response.content)

            print(f'图片 {image_name} 下载成功')
        except Exception as e:
            print(f'图片 {url} 下载失败: {e}')
运行环境 .NET Framework2.0 开发工具 Microsoft Visual Studio 2005 二. 部分代码说明(主要讲解异步分析和下载): 异步分析下载采取的策略是同时分析同时下载,即未等待数据全部分析完毕就开始把已经分析出来的图片链接开始下载下载成功的均在List框链接前面划上了√ ,未能下载图片有可能是分析错误或者是下载异常。 1. 异步分析部分代码 /// /// 异步分析下载 /// private void AsyncAnalyzeAndDownload(string url, string savePath) { this.uriString = url; this.savePath = savePath; #region 分析计时开始 count = 0; count1 = 0; freq = 0; result = 0; QueryPerformanceFrequency(ref freq); QueryPerformanceCounter(ref count); #endregion using (WebClient wClient = new WebClient()) { AutoResetEvent waiter = new AutoResetEvent(false); wClient.Credentials = CredentialCache.DefaultCredentials; wClient.DownloadDataCompleted += new DownloadDataCompletedEventHandler(AsyncURIAnalyze); wClient.DownloadDataAsync(new Uri(uriString), waiter); //waiter.WaitOne(); //阻止当前线程,直到收到信号 } } /// /// 异步分析 /// protected void AsyncURIAnalyze(Object sender, DownloadDataCompletedEventArgs e) { AutoResetEvent waiter = (AutoResetEvent)e.UserState; try { if (!e.Cancelled && e.Error == null) { string dnDir = string.Empty; string domainName = string.Empty; string uri = uriString; //获得域名 http://www.sina.com/ Match match = Regex.Match(uri, @"((http(s)?://)?)+[\w-.]+[^/]");//, RegexOptions.IgnoreCase domainName = match.Value; //获得域名最深层目录 http://www.sina.com/mail/ if (domainName.Equals(uri
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值