批量下载swf文件

包子甘蓝

已于 2024-07-08 13:47:05 修改

阅读量165

点赞数 1

文章标签： python

于 2024-07-04 13:56:37 首次发布

本文链接：https://blog.csdn.net/weixin_43902858/article/details/140177788

版权

1.判断哪些url可用，并保存到本地

# 判断哪些url是存在的
import requests
import pandas as pd

def check_url_status(base_url, start, end):
    valid_urls = []

    for i in range(start, end + 1):
        url = f"{base_url}{i}.swf"
        try:
            response = requests.head(url, timeout=5)
            if response.status_code == 200:
                valid_urls.append(url)
                print(f"URL {url} is valid.")
            else:
                pass
#                 print(f"URL {url} returned status code {response.status_code}.")
        except requests.RequestException as e:
            print(f"Failed to reach {url}: {e}")

    return valid_urls

def save_to_csv(urls, filename):
    df = pd.DataFrame(urls, columns=["Valid URLs"])
    df.to_csv(filename, index=False)
    print(f"Saved valid URLs to {filename}.")

base_url = "http://mole.61.com/resource/map/"
start = 101
end = 200
filename = r"F:\临时文件夹\valid_urls2.csv"

valid_urls = check_url_status(base_url, start, end)
save_to_csv(valid_urls, filename)

2.将url对应的swf文件下载到本地

#从上一个cell里获得的CSV下载所有可用的URL
import os
import requests
import pandas as pd

# 从CSV文件中读取URL列表
def read_urls_from_csv(filename):
    df = pd.read_csv(filename)
    return df['Valid URLs'].tolist()

# 下载SWF文件
def download_swf(url, save_path):
    local_filename = os.path.join(save_path, url.split("/")[-1])
    try:
        with requests.get(url, stream=True) as r:
            r.raise_for_status()
            with open(local_filename, 'wb') as f:
                for chunk in r.iter_content(chunk_size=8192): 
                    f.write(chunk)
        print(f"Downloaded {url} to {local_filename}")
    except requests.RequestException as e:
        print(f"Failed to download {url}: {e}")

# 主函数
def main(csv_filename, save_path):
    # 创建保存路径文件夹（如果不存在）
    if not os.path.exists(save_path):
        os.makedirs(save_path)

    # 读取CSV文件中的URL
    urls = read_urls_from_csv(csv_filename)

    # 下载每个URL对应的SWF文件
    for url in urls:
        download_swf(url, save_path)

# 设置参数
csv_filename = r"F:/临时文件夹/valid_urls.csv"  # CSV文件路径
save_path = r"F:/临时文件夹/素材"  # 下载文件保存路径

# 执行下载
main(csv_filename, save_path)