python爬虫爬取图片

kanguhong

于 2024-10-03 23:50:12 发布

阅读量700

点赞数 1

文章标签： python 爬虫开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012255097/article/details/142697931

版权

"""
   爬取目标：https://pic.netbian.com/ 彼岸图
   首页地址：https://pic.netbian.com/4kmeinv/
   第N页：
   https://pic.netbian.com/4kmeinv/index_N.html
   https://pic.netbian.com/uploads/allimg/240709/194631-1720525591a682.jpg
   仅供学习，不可用于违法用途
"""
import os.path

import requests
from bs4 import BeautifulSoup

headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/128.0.0.0 Safari/537.36"
}

url = "https://pic.netbian.com/4kmeinv/"
response = requests.get(url=url, headers=headers)
response.encoding = "gbk"
# print(response.text)

soup = BeautifulSoup(response.text, 'lxml')
# 获取所有图片
image_list = soup.select("ul.clearfix li a img")
print(image_list)


def download_image(src):
    """
    下载图片
    :param src:图片路径
    :return:
    """
    # 获取图片名称
    file_name = os.path.basename(src)
    print(file_name)
    # 下载图片
    try:
        with open(f"./image/{file_name}", "wb") as file:
            responses = requests.get("https://pic.netbian.com/" + src)
            file.write(responses.content)
            
    except:
        print(src, "下载异常")


for image in image_list:
    # print(image["src"])
    download_image(image['src'])

以上代码内容是根据小峰博主视频教编写

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

kanguhong CSDN认证博客专家 CSDN认证企业博客

码龄11年

150: 原创

4万+: 周排名

6324: 总排名

81万+: 访问

: 等级

7730: 积分

83: 粉丝

199: 获赞

77: 评论

556: 收藏

私信

关注

热门文章

分类专栏

ip 2篇
服务器 1篇
springboot 2篇
ideaui 1篇
nginx
java技术探索 5篇
java 74篇
oracle 29篇
linux 11篇
maven 2篇
solr 10篇
随笔 21篇
图表制作 1篇
highcharts 1篇
easyui 6篇
mysql 4篇
tomcat 4篇
JQuery 8篇
jsp 34篇
java bug 2篇
IDE 5篇
extjs 1篇
JBPM流程 4篇
前端页面框架 5篇
html5 1篇
python 6篇
layui 2篇
js 3篇

最新评论

python爬虫爬取图片
北风之神c: 总结的很全面的爬虫，写得赞，博主用心了。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c8.html ，只需要@boost一行代码，加到任意新/旧爬虫项目就又强又自由又简单。 funboost 分布式函数调度框架，定位于调度用户的任何函数，只要用户在函数里面写爬虫代码，就可以分布式调度爬虫，并且对爬虫函数施加30种控制功能,例如 qps恒定任何时候随意关机重启代码消息万无一失确认消费非常简单的开启多进程叠加线程/协程,这些强大的功能绝大部分爬虫框架还做不到。此框架如果用于爬虫，不管从任何方面比较可以领先scrapy 20年，也比任意写的爬虫框架领先10年。普通爬虫框架一般就设计为url请求调度框架，url怎么请求都是被框内置架束缚死了，所以有些奇葩独特的想法在那种框架里面难以实现，用户需要非常之精通框架本身然后改造框架才能达到随心所欲的驾驭的目的。普通的爬虫框架与用户手写requests 请求解析存储，在流程逻辑上是严重互斥的，要改造成使用那种框架改造需要大改特改。而此框架是函数调度框架，函数里面用户可以随意写一切任意自由想法，天生不会有任何束缚。使用funboost爬虫，与用户使用别的爬虫框架或者无框架用户手写多线程爬虫相比， funboost都代码更少更强更简单更自由。 pip install funboost 或者是直接使用 pip install boost_spider (powerd by funboost ，boost_spider比funboost增加了更加专门的针对爬虫请求和解析和存储） https://github.com/ydf0509/b
linux中ifconfig无法显示ip地址
serendipity. .: 是ens33,但还是没有文件或目录，怎么办？
linux中ifconfig无法显示ip地址
嵌入式门外小菜鸡: 第二种方法输入第二步显示没有那个文件或目录
解决java中io读取文件内容时有空格生成
weixin_47098058: 赞刚开始学习io流打印的时候后面就是一堆空格一下就解决了问题
linux中ifconfig无法显示ip地址
iangyun: 保存的时候为什么显示无法打开并写入问价

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。