python下载大型文件处理

最新推荐文章于 2024-06-24 07:32:29 发布

不侠居

最新推荐文章于 2024-06-24 07:32:29 发布

阅读量2k

点赞数 4

分类专栏： python爬虫文章标签： python 开发语言后端爬虫

本文链接：https://blog.csdn.net/m0_46778548/article/details/121180585

版权

python爬虫专栏收录该内容

10 篇文章 0 订阅

订阅专栏

python下载大型文件处理

1.前述
2.流下载

1.前述

下载大型文件时，我们一般都是这样下载的

import requests
url = ""
r = requests.get(url)
with open('1.mp4', 'wb') as f:
    f.write(r.content)

这样下载大型文件时存在一个问题，那就是内存使用量迅速上升，可能会造成电脑卡死。所以我们需要换一个方式进行下载

2.流下载

我们可以使用文本流进行下载.
在requests模块中有一个这样的方法Response.iter_content()
Response响应对象的一个方法

iter_content(chunk_size=1， decode_unicode=False)

在响应数据上进行重做。当stream=True设置在请求上时，这可以避免立即将内容读入内存以获得大响应。块大小是它应该读入内存的字节数。这不一定是每个返回的项目的长度，因为解码可以进行。

chunk_size必须是类型 int 或 None。值为None时会因stream的值而异。stream-True将读取数据的字块大小与接收的区块相同。如果stream=False，则数据将作为单个块返回。

如果decode_unicode设置为真，响应内容将根据使用最佳编码进行解码。

需要在get请求上设置参数stream为True，它不会立即开始下载，当使用iter_content遍历内容或访问内容属性时才开始下载。

代码实现：

url = ""
r = requests.get(url, headers=header, stream=True)
with open('1.mp4', "wb") as f:
        for chunk in r.iter_content(chunk_size=1024):
            if chunk:
                f.write(chunk)

不侠居

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python下载大型文件处理

python下载大型文件处理1.前述2.流下载1.前述下载大型文件时，我们一般都是这样下载的import requestsurl = ""r = requests.get(url)with open('1.mp4', 'wb') as f: f.write(r.content)这样下载大型文件时存在一个问题，那就是内存使用量迅速上升，可能会造成电脑卡死。所以我们需要换一个方式进行下载2.流下载我们可以使用文本流进行下载.在requests模块中有一个这样的方法Response.
复制链接

扫一扫

专栏目录