- 固定大小记录的文件迭代
- 问题:
- 想在一个固定长度记录或者数据块的集合上迭代,二不是在一个文件中一行一行的迭代
- 解决方案:
- 通过下面这个小技巧使用 iter 和 functools.partial()函数:
from functools import partial
RECORD_SIZE = 32
with open("somefile.txt", "rb") as f:
records = iter(partial(f.read, RECORD_SIZE), b"")
for r in records:
pass
-
这个例子中的 records 是一个可迭代对象,它会不断产生固定大小的数据块,直到文件末尾。要注意的是,如果总记 录大小不是块大小的整数倍的话,ui后一个返回元素的字节数会比期望值少。
-
讨论: iter()函数有一个特性是,如果你给他传递一个可调用对象和一个标记值,它会创建一个迭代器,这个迭代器 会一直调用传入的可调用对象,知道它返回标记值为止,这个时候迭代终止。
-
最后,上面的例子中的文件以二进制模式打开,如果是读取固定大小的记录,这通常是最普遍的情况,而对于文本文件 一行一行的读取(默认的迭代行为)更普遍点。