1.项目背景
使用python下载多个在线的xls文件
2.项目流程
读取txt中url->使用split进行url划分->使用python的request进行下载->保存
3.代码和注释
#读取txt的url
# 打开文件
paperList = []
nameList = []
with open('url.txt', 'r', encoding='utf-8') as file:
for line in file:
print(line.strip())
paperList.append(line.strip())
#根据/切割url
print(line.strip().split('/')[-1])
nameList.append(line.strip().split('/')[-1])
# print(len(paperList))
#使用读取的url下载数据
import requests
import os
import time
#放在download文件夹下
download_folder = 'download'
# 定义文件的URL
for i in range(len(paperList)):
xls_url = paperList[i] # 请替换为实际的XLS文件URL
# 发送HTTP请求获取文件内容
response = requests.get(xls_url)
# 拼接完整的本地文件路径
local_file_path = os.path.join(download_folder, nameList[i])
# 检查响应状态码是否为200,表示请求成功
if response.status_code == 200:
# 指定保存文件的本地路径
local_file_path = local_file_path # 请替换为你想要保存的本地文件路径
# 以二进制写模式打开文件并保存
with open(local_file_path, 'wb') as xls_file:
xls_file.write(response.content)
print(f"XLS文件已成功下载到 {local_file_path}")
else:
print(f"下载失败,状态码:{response.status_code}")
print(f"失败文件名:{nameList[i]}")
time.sleep(1)