Python urllib模块urlretrieve()详解

最新推荐文章于 2024-06-22 15:53:39 发布

灵剑山真人

最新推荐文章于 2024-06-22 15:53:39 发布

阅读量974

点赞数 1

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45850939/article/details/105388574

版权

爬虫——斗师专栏收录该内容

10 篇文章 1 订阅

订阅专栏

Python urllib模块urlretrieve()详解

urlretrieve方法

直接将远程数据下载到本地。

urllib.urlretrieve(url, filename, reporthook=None,data=None)
参数说明：
url：外部或者本地url
filename：指定了保存到本地的路径（如果未指定该参数，urllib会生成一个临时文件来保存数据）；
reporthook：是一个回调函数，当连接上服务器、以及相应的数据块传输完毕的时候会触发该回调。我们可以利用这个回调函数来显示当前的下载进度。
data：指post到服务器的数据。该方法返回一个包含两个元素的元组(filename, headers)，filename表示保存到本地的路径，header表示服务器的响应头。

查了查原因，是python3中使用urlretrieve时应该加.request，即：

urllib.urlretrieve改为urllib.request.urlretrieve即可解决

下面通过例子来演示一下这个方法的使用，这个例子将新浪首页的html抓取到本地，保存在D:/sina.html文件中，同时显示下载的进度。

import urllib
def callbackfunc(blocknum, blocksize, totalsize):
'''''回调函数
@blocknum: 已经下载的数据块
@blocksize: 数据块的大小
@totalsize: 远程文件的大小
'''
percent = 100.0 * blocknum * blocksize / totalsize
if percent > 100:
percent = 100
print "%.2f%%"% percent
url = 'http://www.sina.com.cn'
local = 'd:\\sina.html'
urllib.urlretrieve(url, local, callbackfunc)

灵剑山真人

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Python urllib模块urlretrieve()详解

Python urllib模块urlretrieve()详解urlretrieve方法直接将远程数据下载到本地。urllib.urlretrieve(url,filename,reporthook=None,data=None)参数说明：url：外部或者本地urlfilename：指定了保存到本地的路径（如果未指定该参数，urllib会生成一个临时文件来保存数据）；r...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。