文件输入/输出
13.1与文件进行通信
13.1.2文本模式和二进制模式
所有文件的内容都以二进制形式(0或1)储存。但是,如果文件最初使用二进制编码的字符(例如,ASCII或Unicode)表示文本(就像c字符串那样),该文件就是文本文件,其中包含文本内容。如果文件中的二进制值代表机器语言代码或数值数据或图片或音乐编码,该文件就是二进制文件,其中包含二进制内容。
为了规范文本文件的处理,c提供两种访问文件的途径:二进制模式和文本模式。在二进制模式中,程序可以访问文件的每个字节。而在文本模式中,程序所见的内容和文件的实际内容不同。程序以文本模式读取文件时,把本地环境表示的行末尾或文件结尾映射为c模式。例如,c程序在旧式macintosh中以文本模式读取文件时,把文件中的\r
转换成\n
;以文本模式写入文件时,把\n
转换成\r
。或者,c文本模式程序在MS-DOS平台读取文件时,把\r\n
转换成\n
;写入文件时,把\n
转成\r\n
。在其他环境中编写的文本模式程序也会做类似的转换。
除了以文本模式读写文本文件,还能以二进制模式读写文本文件。如果读写一个旧式MS-DOS文本文件,程序会看到文件中的\r
和\n
字符,不会发生映射。如果要编写旧式mac格式、MS-DOS格式或unix/linux格式的文本模式程序,应该使用二进制模式,这样程序才能确定实际的文件内容并执行相应的动作。
虽然c提供了二进制模式和文本模式,但是这两种模式的实现可以相同。因为unix使用一种文件格式,这两种模式对于unix实现而言完全相同。Linux也是如此。