第7章文件与数据格式化
1.0文件概述
文件标识
文件标识的意义:找到计算机中唯一确定的文件。
文件标识的组成:文件路径、文件名主干、文件扩展名。
操作系统以文件为单位对数据进行管理。
文件类型
根据数据的逻辑存储结构,人们将计算机中的文件分为文本文件和二进制文件。
文本文件:专门存储文本字符数据。
二进制文件:不能直接使用文字处理程序正常读写,必须先了解其结构和序列化规则,再设计正确的反序列化规则,才能正确获取文件信息。
二进制文件和文本文件这两种类型的划分基于数据逻辑存储结构而非物理存储结构,计算机中的数据在物理层面都以二进制形式存储。
标准文件
Python的sys模块中定义了3个标准文件,分别为:
stdin(标准输入文件)。标准输入文件对应输入设备,如键盘。
stdout(标准输出文件)。
stderr(标准错误文件)。标准输出文件和标准错误文件对应输出设备,如显示器。
import sys
file = sys.stdout
file.write("hello")
2.0文件的基本操作
文件的打开、关闭与读写是文件的基础操作,任何更复杂的文件操作都离不开这些操作。
2.1文件的打开与关闭
1.打开文件
内置函数open()用于打开文件,该方法的声明如下:
open(file, mode='r', buffering=-1)
file:文件的路径。
mode:设置文件的打开模式,取值有r、w、a。
buffering:设置访问文件的缓冲方式。取值为0或1
打开模式
名称
描述
r/rb
只读模式
以只读的形式打开文本文件/二进制文件,若文件不存在或无法找到,文件打开失败
w/wb
只写模式
以只写的形式打开文本文件/二进制文件,若文件已存在,则重写文件,否则创建新文件
a/ab
追加模式
以只写的形式打开文本文件/二进制文件,只允许在该文件末尾追加数据,若文件不存在,则创建新文件
r+/rb+
读取(更新)模式
以读/写的形式