python 下载图片损坏_爬虫爬取出的图片下载出错，图片文件直接损坏

最新推荐文章于 2023-03-28 22:33:12 发布

RandomGuy

最新推荐文章于 2023-03-28 22:33:12 发布

阅读量1.3k

点赞数

文章标签： python 下载图片损坏

本文链接：https://blog.csdn.net/weixin_42532067/article/details/112047376

版权

该博客介绍了在Python中使用requests和lxml库爬取网页图片时遇到的下载图片损坏问题，并提供了解决方案。通过设置请求头，爬取指定网站的多页图片链接，然后创建文件夹并下载图片，确保图片文件完整。文章详细展示了爬虫代码实现过程。

摘要由CSDN通过智能技术生成

import requests

import os, sys, stat

from lxml import etree

import time

class HuangMan():

def __init__(self):

#设置请求头

self.headers = {'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'}

self.url_list = []

self.Hman_url_list = []

self.Hman_name_list = []

def get_url_list(self):

#这里是设置爬取到第3页，想要更多的话请自行更改

url = "http://www.93qoqo.com/artlist/27-%d.html"

for i in range(2,4):

#获取第2到3页的url

self.url_list.append(url % i)

#由于第一页网址不同，所以单独写一个获取函数

def start_1(self):

url_1 = "http://www.93qoqo.com/artlist/27.html"

response = requests.get(url_1, headers = self.headers).content.decode('utf-8')

html = etree.HTML(response)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

RandomGuy

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python 图像下载解决图像损坏

aini4568的博客

03-19

1107

在下载图片的过程中，经常会发现图片损坏，下面提供了两种解决方法：方法一： if response.status_code == 200: print '==================================================' if not os.path.exists(dir_path): ...

2020-09-27

weixin_46064684的博客

09-27

197

Date（日期）对象 Date对象分为两种情况： 1. 获取当前时间 2. 录入指定时间注意：指定的对象会跟随1/2两种情况获取不同数据 var da = new Date(); //获取当前时间 console.log(da); //获取当前年 console.log(da.getFullYear()); //获取当前月(0-11) console.log(da.getMonth()+1); //获取当前日 console.log(da.getDate()); //获取当前小时 console.log(

参与评论您还未登录，请先登录后发表或查看评论

python下载文件损坏_Python爬虫，图片下载完后是损坏的，怎么解决？

weixin_39827034的博客

11-20

1122

coding:utf-8import requestsfrom bs4 import BeautifulSoupimport osimport sysreload(sys)sys.setdefaultencoding('utf8')爬取目标url = 'http://www.mzitu.com/page/'parser = 'html.parser'cur_path = os.getcwd() +...

ZooKeeper ： Curator框架之分布式锁InterProcessMutex

kaven

01-17

2140

InterProcessMutex InterProcessMutex类的源码注释： A re-entrant mutex that works across JVMs. Uses Zookeeper to hold the lock. All processes in all JVMs that use the same lock path will achieve an inter-process critical section. Further, this mutex is “fair” - ea

InterProcessMutex实现zookeeper分布式锁原理

m0_45097637的博客

03-19

2698

InterProcessMutex实现zookeeper分布式锁原理原理简介: zookeeper实现分布式锁的原理就是多个节点同时在一个指定的节点下面创建临时会话顺序节点，谁创建的节点序号最小，谁就获得了锁，并且其他节点就会监听序号比自己小的节点，一旦序号比自己小的节点被删除了，其他节点就会得到相应的事件，然后查看自己是否为序号最小的节点，如果是，则获取锁。 zookeeper节点图分析 InterProcessMutex实现的锁机制是公平且互斥的，公平的方式是按照每个请求的顺序进行排队的。 Inte

Zookeeper分布式锁InterProcessMutex源码解析

Hello_noby的博客

01-05

490

目录使用方式基本原理源码解析InterProcessMutex初始化acquire方法使用方式用一下别人的图基本原理客户端在获取zookeeper分布式锁的时候，实际上是通过在节点下，添加临时顺序节点（CreateMode.EPHEMERAL_SEQUENTIAL）。如果当前节点通过"lock-"后面的序号排序是第一个，那么久可以获取到锁源码解析 InterProcessMutex初...

笔记合集爬虫基础系列临近结束课件直接合一起方便自己寻找有空再整理

return_min的博客

12-31

1178

day01 一、爬虫的定义：程序或者脚本---》自动的爬取万维网的数据的程序或者脚本。二、爬虫可以解决的问题：（1）解决冷启动问题。（2）搜索引擎的根基。---通用爬虫。（3）帮助机器学习建立知识图谱。（4）制作各种比价软件。三、爬虫工程师的进阶之路：初级爬虫工程师 1.web 前端的知识： HTML、CSS、JavaSc1ipt、 DOM、 DHTML 、Ajax、j...

python基础面试题

chengchuanji的博客

03-06

1785

python面试题库——1Python基础篇第一部分 Python基础篇（80题）为什么学习Python？语言本身简洁，优美,功能超级强大，跨平台，从桌面应用,web开发,自动化测试运维，爬虫，人工智能，大数据处理都能做 Python和Java、PHP、C、C#、C++等其他语言的对比？ C语言由于其底层操作特性和历史的积累，在嵌入式领域是当之无愧的王者 . PH...

testst

最新发布

小石潭记丶

03-28

157

然后使用zookeeper的可视化工具查看当前节点的信息。等待任务执行完成之后，所有的节点信息都会被移除。2、zookeeper的相关配置。3、使用多线程模拟抢占锁。

zookeeper客户端Curator分布式锁InterProcessMutex的实现

qq_21588061的博客

08-26

412

前面介绍了如何用redis来构建分布式锁 ,今天来介绍下如何通过zookeeper来实现分布式锁。 Curator是zookeeper的一个高级客户端操作API，在Curator中实现了分布式锁，主节点选举等功能。其中分布式锁实现的关键是通过zookeeper创建的节点来实现，稍后会通过代码来说明是如何实现的。那么设想这样一个场景，我有三台独立的机器连接了有5台服务器组成的zookeeper集群，...

python下载图片不完整_【Python】检测下载不完整、半截灰色的JPG、JPEG、PNG图片脚本...

weixin_39860952的博客

11-20

719

爬取图片下载到本地的时候，总有一些图片显示不完全，例如这样：错误图片展示出现这种问题的原因是什么呢？1、网络问题：网络不稳定，接收到的图片信息不完整。也就是说response有问题；2、本地磁盘满了：有时候接收到的图片信息完整，但是本地磁盘存不下了，毕竟一个图片也要好几Mb呢。如何检测错误图片呢？试了很多方法，一个较好的方法就是判断jpg、jpeg、png文件结尾的标识。JPG文件结尾标识：\xf...

Zookeeper客户端Curator可重入排它锁InterProcessMutex

ystyaoshengting的专栏

03-21

1299

InterProcessMutex是一个跨JVM的可重入排它锁，使用Zookeeper来持有锁。所有的JVM的进程通过使用相同的锁路径来完成跨进程的锁机制。该锁是一个公平锁，按照请求的顺序获取排它锁（从Zookeeper角度来看请求顺序） InterProcessMutex public class InterProcessMutex implements InterProcess...

请问我写的python爬虫，为什么爬下来的图片都是坏的

weixin_65473076的博客

01-09

375

python爬虫，爬出来的图片都是损坏的

Curator应用场景(三)-分布式锁InterProcessMutex使用及原理分析

hosaos的博客

04-25

1万+

API说明 InterProcessMutex有两个构造方法 public InterProcessMutex(CuratorFramework client, String path) { this(client, path, new StandardLockInternalsDriver()); } public InterProcessMut...

python爬虫（爬游民星空壁纸）_图片损坏问题

500.13 Server too busy

04-04

3072

__author__ = 'AllenMinD' import requests,urllib from bs4 import BeautifulSoup ans = 1 for page in range(1,12): if page==1: url = 'http://www.gamersky.com/ent/201603/730123.shtml' els

百度图片自动下载Python爬虫的制作与应用

资源摘要信息:"在本教程中，我们将介绍如何使用Python编程语言创建一个简单但功能强大的爬虫，以实现自动搜索并下载百度图片资源。本教程假设读者拥有一定的Python基础知识，但对爬虫开发不熟悉，因此将从基础知识讲...