9.1 文件对象
内建函数open()返回一个文件对象,对该文件进行后续相关的操作都要用到它。
文件只是连续的字节序列。数据的传输经常会用到字节流,无论字节流是由单个字节还是大块数据组成。
9.2 文件内建函数(open()和file())
内建函数open()以及file()提供了初始化输入/输出(I/O)操作的通用接口。
file_object=open(file_name, mode = 'r', buffering = -1)
文件使用模式'r','w',或是'a'模式来打开,分别代表读取,写入,追加。还有个U模式,代表通用换行符支持。使用r或U模式打开的文件必须是已经存在的。使用'w'模式打开的文件若存在则首先清空,然后重新创建。使用'a'模式打开的文件是为追加数据做准备的,所有写入的数据都将追加到文件的末尾,如果文件不存在,将被自动创建。
‘+’代表可读可写,‘b’代表二进制模式访问。指示文件打开模式的字符串中也可以包含字符'b',但它不能作为第一个字符出现。
如果没有指定mode,它将自动采用默认值'r'。
另外一个可选参数buffering用于指示访问文件所采用的缓冲模式。其中0表示不缓冲,1表示只缓冲一行数据,任何其他大于1的值代表使用给定值作为缓冲区大小。不提供该参数或者给定负值代表使用系统默认缓冲机制。
9.2.1 工厂函数file()
open()和file()函数具有相同的功能,可以任意替换。
9.2.2 通用换行符支持(UNS)
当你使用‘U’标志打开文件时,所有的行分隔符通过Python的输入方法返回时都会被替换为NEWLINE(\n)。这个特性和支持包含不同类型行结束符的文件。文件对象的newlines属性会记录它曾‘看到的’文件的行结束符。
如果文件刚被打开,程序还没有遇到行结束符,那么文件的newlines为None。在第一行被读取后,它被设置为第一行的结束符。如果遇到其他类型的行结束符,文件的newlines会成为一个包含各种格式的元组。注意UNS只用于读取文本文件。没有对应的处理文件输出的方法。