文章目录
前言
所有程序都要处理输入和输出,需要处理不同的文件,包括文本和二进制文件,文件编码、文件名和目录等的操作。
1. 字符串的 I/O 操作
使用 io.StringIO() 和 io.BytesIO() 类来创建类文件对象操作字符串数据
>>> s = io.StringIO()
>>> s.write('Hello World\n')
12
>>> print('This is a test', file=s)
15
>>> # Get all of the data written so far
>>> s.getvalue()
'Hello World\nThis is a test\n'
>>>
>>> # Wrap a file interface around an existing string
>>> s = io.StringIO('Hello\nWorld\n')
>>> s.read(4)
'Hell'
>>> s.read()
'o\nWorld\n'
>>>
io.StringIO 只能用于文本。如果你要操作二进制数据,要使用 io.BytesIO 类来代替
>>> s = io.BytesIO()
>>> s.write(b'binary data')
>>> s.getvalue()
b'binary data'
>>>
当你想模拟一个普通的文件的时候 StringIO 和 BytesIO 类是很有用的。比如,在单元测试中,你可以使用 StringIO 来创建一个包含测试数据的类文件对象,这个对象可以被传给某个参数为普通文件对象的函数.
2.读写压缩文件
怎么读写一个压缩文件呢
gzip 和 bz2 模块可以很容易的处理这些文件。两个模块都为 open() 函数提供了另外的实现来解决这个问题。示例为以文本形式读取压缩文件
##########读出#########
import gzip
with gzip.open('somefile.gz', 'rt') as f:
text = f.read()
import bz2
with bz2.open('somefile.bz2', 'rt') as f:
text = f.read()
##########写入#######
import gzip
with gzip.open('somefile.gz', 'wt') as f:
f.write(text)
import bz2
with bz2.open('somefile.bz2', 'wt') as f:
f.write(text)
同样如果你想操作二进制数据,使用 rb 或者 wb 文件模式即可。
大部分情况下读写压缩数据都是很简单的。但是要注意的是选择一个正确的文件模式是非常重要的。如果你不指定模式,那么默认的就是二进制模式,如果这时候程序想要接受的是文本数据,那么就会出错。 gzip.open() 和 bz2.open() 接受跟内置的open() 函数一样的参数,包括 encoding, errors, newline 等等。
当写入压缩数据时,可以使用 compresslevel 这个可选的关键字参数来指定一个压缩级别。比如:
with gzip.open('somefile.gz', 'wt', compresslevel=5) as f:
f.write(text)
3.读取二进制数据到可变缓冲区中
你想直接读取二进制数据到一个可变缓冲区中,而不需要做任何的中间复制操作。或者你想原地修改数据并将它写回到一个文件中去
为了读取数据到一个可变数组中,可以使用文件对象的 readinto() 方法
import os