使用python爬取图片

最新推荐文章于 2024-05-21 16:18:28 发布

珩杰软件设计

最新推荐文章于 2024-05-21 16:18:28 发布

阅读量231

点赞数 2

文章标签： python 开发语言

本文链接：https://blog.csdn.net/pursue_mony/article/details/138664012

版权

使⽤ requests 库来获取⽹⻚内容，并⽤ BeautifulSoup 来解析HTML，找到所有图⽚的URL。然后，可以⽤ requests 再次下载这些图⽚并将它们保存到本地。

以下是⼀个简单的图⽚下载器的⽰例代码。这个脚本会下载指定⽹⻚上的所有图⽚到⼀个名为downloaded_images 的本地⽂件夹中。请确保在运⾏脚本之前已经创建了这个⽂件夹，或者修改脚本以创建它。

import requests
from bs4 import BeautifulSoup # requests 和 BeautifulSoup 为第三方库，需要安装 ,安装命令：  pip install requests BeautifulSoup
import os

#目标网页地址
url='https://kkmzt.com/'

#发生HTTP GET请求
response = requests.get(url)

# 确保请求成功
if response.status_code == 200:
    #使用 BeautifulSoup 解析网页内容
    soup = BeautifulSoup(response.text,'html.parser')
    print(soup)
    # 创建保存图⽚的⽬录
    folder_path = 'downloaded_images'
    if not os.path.exists(folder_path):
        os.makedirs(folder_path)
    # 查找所有图⽚标签
    for img in soup.find_all('img'):
        img_url = img.get('src')
        # 确保img_url不为空且为完整的URL
        if img_url and img_url.startswith('http'):
            img_data = requests.get(img_url).content
            img_name = os.path.join(folder_path, img_url.split('/')[-1])
            # 写⼊图⽚数据到⽂件
            with open(img_name, 'wb') as file:
                file.write(img_data)
            print(f'Downloaded {img_name}')
else:
    print('请求失败，状态码：',response.status_code)

这个脚本图⽚的URL是完整的（即，以 http 或 https 开始）。有些⽹站可能使⽤相对路径来指向图⽚，在这种情况下，需要修改脚本来构建完整的URL。

此外，由于⽹络请求的性质，尝试下载⼤量图⽚或从响应时间较⻓的服务器下载时，脚本可能会运⾏较慢。在本地环境中运⾏上述脚本时，需替换 url 变量的值为你想要下载图⽚的⽹⻚地址，然后运⾏脚本。

如果⽹⻚上的图⽚URL是完整的，脚本将会下载所有找到的图⽚到指定的⽂件夹中。

珩杰软件设计

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
使用python爬取图片

以下是⼀个简单的图⽚下载器的⽰例代码。这个脚本会下载指定⽹⻚上的所有图⽚到⼀个名为downloaded_images 的本地⽂件夹中。此外，由于⽹络请求的性质，尝试下载⼤量图⽚或从响应时间较⻓的服务器下载时，脚本可能会运⾏较慢。在本地环境中运⾏上述脚本时，需替换 url 变量的值为你想要下载图⽚的⽹⻚地址，然后运⾏脚本。有些⽹站可能使⽤相对路径来指向图⽚，在这种情况下，需要修改脚本来构建完整的URL。如果⽹⻚上的图⽚URL是完整的，脚本将会下载所有找到的图⽚到指定的⽂件夹中。
复制链接

扫一扫