python urlretrieve不能保存_python 爬虫利用urllib.request.urlretrieve() 保存图片在本地，图片没有内容...

最新推荐文章于 2022-06-16 15:03:56 发布

weixin_39849127

最新推荐文章于 2022-06-16 15:03:56 发布

阅读量613

点赞数

文章标签： python urlretrieve不能保存

本文链接：https://blog.csdn.net/weixin_39849127/article/details/112926456

版权

我用Jupyter Notebook爬取了需要保存的图片的url，但是利用urllib.request.urlretrieve() 将图片保存到本地，图片没有内容，该url使用360浏览器打开也是没有内容的图片(和我保存在本地一样)，但是用goole打开就是正常的图片。

相关代码

url='http://www.jj20.com/bz/zrfg/d...'

response=urllib.request.urlopen(url)

html=response.read().decode('gb2312')

soup=BeautifulSoup(html,'lxml')

data=soup.select('body > div.wzfz.top-main.fix > div > ul.pic2.vvi.fix')

data2=re.findall('src="(.+?)" width',str(data))

data2 #此处得到了图片链接的一个列表

x=0

for itemm in data2:

print(itemm)

urllib.request.urlretrieve(itemm,'C:\\Users\\Administrator\\Desktop\\pachong2\\%s.jpg'%x)

x+=1 #通过链接保存图片到本地

代码完毕，运行不报错，但保存的图片却是加密图片，如下

我用360浏览器打开这些url也是显示这个，但是用goole打开就是正常的图片。如下：

我百度了好多相关内容，但和别人的出错结果都不一样，想知道这种情况是怎么回事，为什么360浏览器打开是这样的，还有就是要怎么才能通过goole浏览器把图片下载下来呢。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39849127

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python爬虫实例——基于BeautifulSoup与urllib.request

08-12

6. 下载图片：使用`urllib.request.urlretrieve()`或自定义方法，将图片下载到本地。可能需要创建一个目录来存储所有图片，确保文件名的唯一性。 7. 错误处理：在实际操作中，可能会遇到网络错误、编码问题或无效的...

python urlretrieve 失败_Python urlretrieve无法下载某些图像

weixin_39541693的博客

12-22

581

我用这个代码片断下载图片：urllib.request.urlretrieve('https://www.facebook.com/photo/download/?fbid=166644340383715','image_name.jpg')下载成功，就像其他的图像，但是当我试图打开它，我得到了错误：Unknown file format, empty/damaged file or file n...

参与评论您还未登录，请先登录后发表或查看评论

termux使用教程python-Termux折腾记--进阶之python库使用

weixin_37988176的博客

11-01

4796

sshdTermux超级终端折腾记Termux超级终端的牛x之处我就不在这里描述了。这次讲的是如何在android手机上安装python的各种科学库和图形库。Jupyter是这次介绍的重点对象，先卖个关子，不忙介绍它。1. Termux超级终端下载Termux的下载链接极其介绍见我的其他博文2. 安装python这一步只是作为一个提示，因为现在你不管是装Linux终端还是linux完整发行版，py...

termux+python 手机绘图篇

shijilongren的博客

08-28

3107

白天

爬虫----request简介（以及urllib模块和request模块保存图片区别）

R71802的博客

04-01

6181

这里写自定义目录标题欢迎使用Markdo4wn编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdo4wn编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用M

Python urllib.request对象案例解析

12-17

Python的`urllib`库是进行网络数据请求和处理的基础工具，特别在Web爬虫领域中扮演着重要的角色。这个库包含多个子模块，每个子模块都有特定的功能，旨在简化HTTP和其他协议的数据获取。 1. **urllib.request**模块...

python爬虫_爬取百度图片.zip

最新发布

10-14

通过`urllib.request.urlretrieve(url, filename)`，我们可以将图片保存到本地。注意，为了防止文件名冲突，通常需要对URL进行处理，如添加时间戳或随机数。然而，爬虫在实际运行中可能会遇到各种问题，如验证码、...

Python爬虫知识点.pdf

03-13

例如，使用urllib.request.urlretrieve函数可以将图片保存到文件中。 7. 正则表达式正则表达式是一种模式匹配语言，用于匹配字符串中的模式。Python爬虫可以使用re库来使用正则表达式。例如，使用re.compile函数...

python urlretrieve不能保存_无法在Python中使用“urllib.request.urlretrieve”下载图像

weixin_36289211的博客

02-19

241

Traceback(最近一次调用最后一次)：文件“/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/request.py”，第1318行，在do_open encode_chunked = req.has_header('转移-encoding'))文件“/Library/Frameworks/Python...

python爬虫下载文件到指定文件夹_python - 图片爬虫时候遇到问题 urllib.request.urlretrieve 下载到指定文件夹不成功？...

weixin_39662721的博客

11-23

503

问题如果下载到D盘也是没有问题的，下载到我建立的目录下就有问题（主要是我想在D盘建立以URL这个问号前面的数字为名字的目录如（http://v.yupoo.com/photos/196...'）中的46975340就是不行，因为有很多链接，每个链接的这个数字不同，我想用这个数字作为文件夹的名字，存放这个链接下载下来的图片）源码如下：import urllib.requestimport reim...

python 下载保存图片的urllib.urlretrieve()函数简单用法

大蛇王的博客

12-18

4060

运行环境python2.7 #coding=utf-8 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext'

爬虫-urllib.request下载文件函数urlretrieve()

suxiaorui的博客

04-26

2550

下载文件函数urlretrieve() 作用：自动的将求请地址得到的响应体保存到指定文件中函数原型：urlretrieve(url, filename=None, reporthook=None, data=None) 参数含义： url：资源地址 filename：文件本地保存路径 reporthook：回调函数，每下载一块数据到本地，都会调用此函数。reporthook(bloc...

下载！ urllib.request.urlretrieve用于下载链接URL的内容到本地filepath里面，里面的回调参数可查看进度

zz2230633069的博客

07-30

3552

python3.x 版本将urllib与urllib2合并为urllib urllib is a package that collects several modules for working with URLs: urllib.request for opening and reading URLs urllib.error containing the exceptions rai...

PYTHON urllib.request 请求，保存图片

高建设的专栏

06-16

1018

PYTHON urllib.request 请求，保存图片

爬虫卡死问题带图片保存的urlretrieve 和urlopen

bining博客

12-26

4172

爬虫卡死问题带图片保存的urlretrieve 和urlopen 原保存图片子函数错误原因更改后的保存图片子函数可以开始愉快的爬辣爬虫卡死问题带图片保存的urlretrieve 和urlopen之前做个小爬虫爬点文字混合图片的东西，数据量小还可以处理，数据一大自己假死，也没有错误提示，搞得自己有点烦，在这总结一下：原保存图片子函数########使用当前执行时间来命名图片，lujing为

150讲轻松学习Python网络爬虫

05-16

【为什么学爬虫？】 1、爬虫入手容易，但是深入较难，如何写出高效率的爬虫，如何写出灵活性高可扩展的爬虫都是一项技术活。另外在爬虫过程中，经常容易遇到被反爬虫，比如字体反爬、IP识别、验证码等，如何层层攻克难点拿到想要的数据，这门课程，你都能学到！ 2、如果是作为一个其他行业的开发者，比如app开发，web开发，学习爬虫能让你加强对技术的认知，能够开发出更加安全的软件和网站【课程设计】一个完整的爬虫程序，无论大小，总体来说可以分成三个步骤，分别是：网络请求：模拟浏览器的行为从网上抓取数据。数据解析：将请求下来的数据进行过滤，提取我们想要的数据。数据存储：将提取到的数据存储到硬盘或者内存中。比如用mysql数据库或者redis等。那么本课程也是按照这几个步骤循序渐进的进行讲解，带领学生完整的掌握每个步骤的技术。另外，因为爬虫的多样性，在爬取的过程中可能会发生被反爬、效率低下等。因此我们又增加了两个章节用来提高爬虫程序的灵活性，分别是：爬虫进阶：包括IP代理，多线程爬虫，图形验证码识别、JS加密解密、动态网页爬虫、字体反爬识别等。Scrapy和分布式爬虫：Scrapy框架、Scrapy-redis组件、分布式爬虫等。通过爬虫进阶的知识点我们能应付大量的反爬网站，而Scrapy框架作为一个专业的爬虫框架，使用他可以快速提高我们编写爬虫程序的效率和速度。另外如果一台机器不能满足你的需求，我们可以用分布式爬虫让多台机器帮助你快速爬取数据。从基础爬虫到商业化应用爬虫，本套课程满足您的所有需求！【课程服务】专属付费社群+定期答疑