Python3读取大文件的方法
1. 方法一:利用yield生成器
def readPart(filePath, size=1024, encoding="utf-8"):
with open(filePath,"r",encoding=encoding) as f:
while True:
part = f.read(size)
if part:
yield part
else:
return None
filePath = r"filePath"
size = 2048 # 每次读取指定大小的内容到内存
encoding = 'utf-8'
for part in readPart(filePath,size,encoding):
print(part)
# Processing data
2. 方法二:利用open()自带方法生成迭代对象,这个是一行一行的读取
with open(filePath) as f:
for line in f:
print(line)
# Processing data
3. 二者的比较
方法一可以灵活控制一次读取的size,在速度上较2有优势,适用于一些大的二进制文件,比如读取一些大的视频或者图片等。
方法二在处理一些文本的时候感觉更加便利,按行读更容易对文本进行处理。
关于两种方法的应用场景,欢迎小伙伴评论留言。
后记:
我从本硕药学零基础转行计算机,自学路上,走过很多弯路,也庆幸自己喜欢记笔记,把知识点进行总结,帮助自己成功实现转行。
2020下半年进入职场,深感自己的不足,所以2021年给自己定了个计划,每日学一技,日积月累,厚积薄发。
如果你想和我一起交流学习,欢迎大家关注我的微信公众号每日学一技
,扫描下方二维码或者搜索每日学一技
关注。
这个公众号主要是分享和记录自己每日的技术学习,不定期整理子类分享,主要涉及 C – > Python – > Java,计算机基础知识,机器学习,职场技能等,简单说就是一句话,成长的见证!