Python面试题-读书笔记

1 文件操作

① 有一个jsonline格式的文件file.txt大小约为10k

def get_lines():
	with open('file.txt','rb') as f:
		return f.readlines()
	if __name__ == '_main_':
		for e in get_lines():
			process(e) #process each line data

如果处理大小为10G的文件,但是内存只有4G,只能修改get_lines函数,应该如何实现,需要考虑的问题有哪些?

#1
def get_lines():
	with open('file.txt','rb') as f:
		for i in f:
			yield i

#2 设置每次返回的行数,避免读取次数太多。
def get_lines():
	l = []
	with open('file.txt','rb') as f:
		data = f.readlines(60000)
	l.append(data)
	yield l

#3
import mmap import mmap

def get_lines(fp):
	with open(fp,"r+") as f:
		m = mmap(f.fileno(),0)
		tmp = 0
		for i char in enumerate(m):
			if char = b"\n":
				yield m[tmp:i+1].decode()
				tmp = i+1

if __name__ == "_main_":
	for i in get_lines("fp_some_h
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值