python内置模块io模块,处理各种类型的IO操作流

一、简介

Python中的io模块是用来处理各种类型的I/0操作流。主要有三种类型的IO类型:text I/O , binary I/O 和 raw I/O。它们都是通用类别,每一种都有不同的后备存储。属于这些类别中的任何一个的具体对象称为文件对象,其他常用的术语为流或者类文件对象
除了它的类别,每一种具体的流对象也具有各种功能:它仅仅允许读,或者仅仅允许写,或者既能读又能写。
它也允许任意随机访问(向前或者向后寻找任何位置),或者仅仅顺序访问(例如在套接字或管道中)。
所有的流对于提供给它们的数据的数据类型都很严格。例如,如果用一个二进制流的write ()方法写一个字符类型的数据,那么将会触发一个TypeError错误。用文本流的write()方法来写字节对象数据也是一样的,会触发该错误

二、Text I/O:io.StringIO

用于创建一个在内存中操作字符串数据的类文件对象,使用 io.StringIO() 创建一个类文件对象,将字符串数据写入其中,然后从中读取数据。这对于处理字符串数据而不涉及实际文件操作的场景非常有用。

  1. 使用场景
  • 与需要文件接口的函数或模块的集成:某些函数或模块可能需要文件对象作为输入,但不想创建实际的文件。在这种情况下,您可以使用 io.StringIO() 创建一个类文件对象,将字符串数据提供给这些函数或模块进行处理。
  • 测试和调试:在测试和调试代码时,可能希望模拟文件操作而不实际创建文件。使用 io.StringIO(),可以创建一个类文件对象来模拟文件,并进行读取和写入操作,以便更轻松地测试和调试代码。
  • 数据处理和转换:有时可能需要对字符串数据进行处理和转换,例如解析、拆分、格式化等。使用 io.StringIO(),您可以将字符串数据加载到类文件对象中,然后使用文件操作的方法和功能来处理和转换数据。
  1. string_io = io.StringIO(initial_value=‘’, newline=‘\n’):创建Text I/O对象
  • initial_value:初始值
  • newline:指定换行符的字符串。当读取或写入 StringIO 对象时,将使用指定的换行符进行换行操作
  1. string_io.seek(offset, whence=0):将读取/写入位置移动到指定位置
  • offset:表示偏移量
  • whence:表示相对位置。默认为 0,表示相对于文件开头;1 表示相对于当前位置;2 表示相对于文件末尾。
  1. string_io.tell():返回当前读取/写入位置的偏移量
  2. string_io.getvalue():返回整个 StringIO 对象中的字符串内容
  3. string_io.write(str):将字符串写入 StringIO 对象
  4. string_io.writelines(lines):将多行字符串写入StringIO对象。lines是一个包含多行字符串的可迭代对象。
  5. string_io.read(size):读取指定大小的字符数据,如果未指定 size,则读取整个字符串,读取前需使用string_io.seek指定位置
  6. string_io.readline(size):读取一行字符数据。如果未指定 size,则读取整行,读取前需使用string_io.seek指定位置
  7. string_io.readlines(hint=-1):读取多行字符数据,并返回一个列表,每行作为列表中的一个元素。如果指定了 hint,则最多读取 hint 个字符,读取前需使用string_io.seek指定位置
  8. truncate(size=None):将 StringIO 对象截断为指定大小。如果未指定 size,则截断为当前读取/写入位置
  9. string_io.flush():将 StringIO 对象的缓冲区内容刷新到底层的字符串中,在写入操作之后调用 flush() 方法可以确保数据被写入
  10. string_io.isatty():指示 StringIO 对象是否被认为是一个终端设备(tty),由于 StringIO 对象不是真正的终端设备,因此该方法始终返回 False。
  11. string_io.readable():指示 StringIO 对象是否可读,对于 StringIO 对象,该方法始终返回 True
  12. string_io.seekable():指示 StringIO 对象是否支持寻址操作,对于 StringIO 对象,该方法始终返回 True。
  13. string_io.writable():指示 StringIO 对象是否可写,对于 StringIO 对象,该方法始终返回 True。
import io

with io.StringIO() as string_io:
    string_io.write('hello word!\n')
    string_io.write('hello china!')
    string_io.seek(0)
    print(string_io.read())
三、 Binary I/O:io.BytesIO

在内存中创建一个类似文件的对象,用于处理二进制数据

  1. binary_io = io.BytesIO(initial_bytes):创建Binary I/O对象
  2. binary_io.seek(offset, whence=0):将读取/写入位置移动到指定位置
  • offset:表示偏移量
  • whence:表示相对位置。默认为 0,表示相对于文件开头;1 表示相对于当前位置;2 表示相对于文件末尾。
  1. binary_io.tell():返回当前读取/写入位置的偏移量
  2. binary_io.getvalue():返回整个 BytesIO 对象中的字符串内容
  3. binary_io.write(str):将字符串写入 BytesIO 对象
  4. binary_io.writelines(lines):将多行字符串写入BytesIO对象。lines是一个包含多行字符串的可迭代对象。
  5. binary_io.read(size):读取指定大小的字符数据,如果未指定 size,则读取整个字符串,读取前需使用binary_io.seek指定位置
  6. binary_io.readline(size):读取一行字符数据。如果未指定 size,则读取整行,读取前需使用binary_io.seek指定位置
  7. binary_io.readlines(hint=-1):读取多行字符数据,并返回一个列表,每行作为列表中的一个元素。如果指定了 hint,则最多读取 hint 个字符,读取前需使用binary_io.seek指定位置
  8. truncate(size=None):将 BytesIO 对象截断为指定大小。如果未指定 size,则截断为当前读取/写入位置
  9. binary_io.flush():将 BytesIO 对象的缓冲区内容刷新到底层的字符串中,在写入操作之后调用 flush() 方法可以确保数据被写入
  10. binary_io.isatty():指示 BytesIO 对象是否被认为是一个终端设备(tty),由于 BytesIO 对象不是真正的终端设备,因此该方法始终返回 False。
  11. binary_io.readable():指示 BytesIO 对象是否可读,对于 BytesIO 对象,该方法始终返回 True
  12. binary_io.seekable():指示 BytesIO 对象是否支持寻址操作,对于 BytesIO 对象,该方法始终返回 True。
  13. binary_io.writable():指示 BytesIO 对象是否可写,对于 BytesIO 对象,该方法始终返回 True。
import io

with io.BytesIO() as binary_io:
    binary_io.write(b'hello word!\n')
    binary_io.write(b'hello china!')
    binary_io.seek(0)
    print(binary_io.read())
四、Raw I/O:io.FileIO

用于创建原始(Raw)文件 I/O 对象,它提供了一个底层的接口,可以直接读取或写入文件的原始二进制数据,而无需进行任何编码或解码。

  1. raw_io=io.FileIO(file,…,closefd):):创建Raw I/O对象
  • file:要打开的文件路径,可以是一个字符串表示的文件路径,也可以是一个已经打开的文件对象,如果省略该参数,则创建一个未关联任何文件的 FileIO 对象。
  • mode:打开文件的模式
'r':只读模式。文件必须存在,否则会引发 FileNotFoundError。
'w':写入模式。如果文件存在,会被截断为空文件;如果文件不存在,会创建新文件。
'x':独占创建模式。只能用于创建新文件,如果文件已经存在则会引发 FileExistsError。
'a':追加模式。如果文件存在,写入数据会追加到文件末尾;如果文件不存在,会创建新文件。
'b':二进制模式。用于处理二进制数据,与其他模式结合使用。
't':文本模式。用于处理文本数据,与其他模式结合使用。
'+':读写模式。允许对文件进行读取和写入操作,与其他模式结合使用。
  • buffering:缓冲设置。可选参数,默认值为 -1,表示使用默认的缓冲设置
0:无缓冲,直接进行 I/O 操作。
1:行缓冲,每次写入一行数据。
大于 1 的整数:指定缓冲区大小。
-1 或默认值:使用默认缓冲设置。
  • encoding:文本编码,仅在文本模式下有效,用于指定读取和写入文本数据时使用的编码方式。默认值为 None,表示使用系统默认编码。
  • errors:编码错误处理方式,仅在文本模式下有效,用于指定在编码或解码过程中遇到错误时的处理方式。默认值为 None,表示使用默认错误处理方式。
  • newline:文本换行符,仅在文本模式下有效。用于指定读取和写入文本数据时使用的换行符。默认值为 None,表示使用系统默认换行符。
  • closefd:关闭文件描述符,默认值为 True,表示在关闭 FileIO 对象时同时关闭底层文件描述符。如果为 False,则只关闭 FileIO 对象,不关闭底层文件描述符。
  1. raw_io.write(b):用于将指定的字节数据写入文件。b 是要写入的字节数据,可以是 bytes 或 bytearray 类型。返回值是成功写入的字节数。
  2. raw_io.read(size):用于从文件中读取指定数量的字节数据。size 是要读取的字节数,默认值为 -1 表示读取整个文件。返回值是读取到的字节数据。
  3. raw_io.seek(offset, whence):用于设置文件读写位置。offset 是相对于指定 whence 的偏移量,可以是正数或负数。whence 是指定偏移量的参考位置,默认值为 0 表示相对于文件开头。返回值是新的文件读写位置。
  4. raw_io.readline(size):用于从文件中读取一行数据。size 是要读取的最大字节数,默认值为 -1 表示读取整行数据。返回值是读取到的字节数据。
  5. raw_io.seekable():用于检查文件是否支持随机访问(即是否可以使用 seek() 方法)。返回值是一个布尔值,为 True 表示文件支持随机访问,为 False 表示文件不支持随机访问。
  6. raw_io.readlines(hint):用于从文件中读取多行数据并返回一个列表,每行数据是一个字节字符串。hint 是要读取的最大字节数,默认值为 -1 表示读取所有行。返回值是一个包含多行数据的列表。
  7. raw_io.writelines(lines):用于将多行字节数据写入文件。lines 是一个可迭代对象,每个元素是要写入的字节数据(bytes 或 bytearray)。会将每行数据写入文件。
  8. raw_io.truncate(size):用于截断文件到指定的大小。size 是要截断的文件大小,默认值为 None 表示截断到当前位置。返回值是截断后的文件大小。
  9. raw_io.writable():用于检查文件是否可写。返回值是一个布尔值,为 True 表示文件可写,为 False 表示文件不可写。
  10. raw_io.fileno():用于获取文件的底层文件描述符。返回值是一个整数,表示文件的文件描述符。
  11. raw_io.isatty():用于检查文件是否是一个终端设备(tty)。返回值是一个布尔值,为 True 表示文件是一个终端设备,为 False 表示文件不是终端设备。
  12. raw_io.flush():用于将缓冲区的数据刷新到文件中。调用会将缓冲区的数据立即写入文件。
  13. raw_io.close():用于关闭文件。调用会关闭文件并释放资源。
  14. raw_io.tell():用于获取当前的文件读写位置。返回值是一个整数,表示当前的文件读写位置。
  15. raw_io.readall():用于读取剩余的文件数据,从当前位置到文件末尾。返回值是读取到的字节数据。
  16. raw_io.readinto(b):用于将文件数据读取到指定的可写入的字节数组或内存视图中。b 是一个可写入的字节数组(bytearray)或内存视图(memoryview)。返回值是成功读取的字节数。
  17. raw_io.readable():用于检查文件是否可读。返回值是一个布尔值,为 True 表示文件可读,为 False 表示文件不可读。
五、其他
  1. io.open(): 用于打开文件并返回一个文件对象。它是 io 模块中的一个高级函数,提供了更简单的文件打开方式,与内置的 open() 函数类似。
  2. io.open_code(): 用于打开编码的文件并返回一个文件对象。它类似于 io.open(),但专门用于处理编码的文件。
  3. io.IOBase: 用作所有 I/O 类的基类。它定义了共享的方法和属性,用于处理文件 I/O 操作。
  4. io.RawIOBase: io.IOBase 的子类,用于处理原始的二进制 I/O 操作。它提供了底层的 I/O 功能,如读取和写入字节数据。
  5. io.TextIOBase: io.IOBase 的子类,用于处理文本 I/O 操作。它提供了用于读取和写入文本数据的功能,对字节数据进行编码和解码。
  6. io.BufferedIOBase: io.IOBase 的子类,用于提供缓冲功能的文件 I/O 操作。它在底层的原始 I/O 操作之上添加了缓冲功能,提高了读写性能。
  7. io.TextIOWrapper: io.TextIOBase 的子类,用于将字节流包装成文本流。它提供了文本编码和解码的功能,以及对文本数据的高级操作。
  8. io.BufferedReader: io.BufferedIOBase 的子类,用于提供缓冲的读取操作。它在底层的原始 I/O 操作之上添加了读取缓冲,提高了读取性能。
  9. io.BlockingIOError: 表示在阻塞 I/O 操作中发生的错误。它通常在使用非阻塞 I/O 操作时抛出。
  10. io.BufferedRandom: io.BufferedIOBase 的子类,用于提供随机访问的缓冲 I/O 操作。它在底层的原始 I/O 操作之上添加了缓冲和随机访问功能。
  11. io.BufferedRWPair: io.BufferedIOBase 的子类,用于将两个文件对象组合成一个读写对。它提供了读取和写入操作的缓冲功能。
  12. io.BufferedWriter: io.BufferedIOBase 的子类,用于提供缓冲的写入操作。它在底层的原始 I/O 操作之上添加了写入缓冲,提高了写入性能。
  13. io.IncrementalNewlineDecoder: 这是一个类,用于处理增量式的换行符解码。它可以将不同平台上的换行符统一为。
  14. io.UnsupportedOperation: 表示不支持的文件操作。当尝试在不支持的文件模式下执行特定操作时,会引发该异常。
  15. io.DEFAULT_BUFFER_SIZE: 表示默认的缓冲区大小。它用于指定缓冲 I/O 操作中使用的默认缓冲区大小。
  16. io.SEEK_CUR, io.SEEK_SET, io.SEEK_END: 这些是常量,用于指定文件定位操作的参考位置。它们分别表示当前位置、文件开头和文件末尾。
  • 25
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值