一日一技:在Python中创建临时文件用于记录临时数据

当我们在做数据分析的时候,可能会由于数据量过大导致内存不足。如果我们没有条件使用更高配置的电脑,也没有办法优化数据,那么我们可以先把计算的中间值存放在一个文本文件中。例如:

# 第一步计算分成中间数据
with open('temp.txt', 'w', encoding='utf-8') as f:
    f.write('中间数据')
# 从内存中清空中间数据,腾出空间
# 后续计算
# 汇总数据
with open('temp.txt', 'r', encoding='utf-8') as f:
    中间数据 = f.read()
# 使用中间数据进一步计算

这种方案虽然有效,但是中间数据写成的临时文件如果不清理,时间一长就会占用大量硬盘空间。当然你也可以每一次都覆盖临时文件,这样它虽然不会堆积,但当你的分析程序已经停止的时候,临时文件还在硬盘上占用空间。

Python实际上早就考虑到了这个需求,专门有模块用于读写临时文件。

这个模块的名字就叫做 tempfile。它的用法也非常简单:

from tempfile import TemporaryFile
with TemporaryFile('w+t', encoding='utf-8') as f:
    # 生成中间数据
    f.write('中间数据')
    f.write('另一部分中间数据')
    # 其他计算过程
    # 下面开始读取临时文件
    f.seek(0)
    f.read()
# 退出with上下文,临时文件自动被删除

由于临时文件被关闭就会被删除,所以需要实现同时读写文件,因此文件模式为 w+t

临时文件也可以像 open一样不使用上下文管理器:

from tempfile import TemporaryFile
f = TemporaryFile('w+t', encoding='utf-8')
# 生成中间数据
f.write('中间数据')
f.write('另一部分中间数据')
# 其他计算过程
# 下面开始读取临时文件
f.seek(0)
f.read()
# 关闭并自动删除临时文件
f.close()

使用 TemporaryFile,你没法知道这个临时文件叫做什么名字。如果你想知道文件名,甚至想让另一个程序打开这个临时文件,那么你可以使用 NamedTemporaryFile

import redis
from tempfile import NamedTemporaryFile
with NamedTemporaryFile('w+t') as f:
    # 把文件名通过某种方式传给其他程序
    client = redis.Redis()
    client.set('temp_file', f.name)
    # 后续操作

只要这个临时文件还没有被关闭,那么另一个程序就可以读取这个临时文件。

大家好,我是老表
觉得本文不错的话,转发、留言、点赞,是对我最大的支持。

每日留言

说说你读完本文感受?

或者一句激励自己的话?

(字数不少于15字)

怎么加入刻意学习队伍

点我,看文末彩蛋

留言有啥福利

点我就知道了

想进学习交流群

加微信:jjxksa888

:简说Python

2小时快速掌握Python基础知识要点

完整Python基础知识要点

Python小知识 | 这些技能你不会?(一)

Python小知识 | 这些技能你不会?(二)

Python小知识 | 这些技能你不会?(三)

Python小知识 | 这些技能你不会?(四)

近期推荐阅读:

【1】整理了我开始分享学习笔记到现在超过250篇优质文章,涵盖数据分析、爬虫、机器学习等方面,别再说不知道该从哪开始,实战哪里找了

【2】【终篇】Pandas中文官方文档:基础用法6(含1-5)

觉得不错就点一下“在看”吧 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值