文件是保存于存储介质中的数据集合,按存储格式可将文件分为文本文件和二进制文件。Python
使用文件对象来读写文件,文件对象根据读写模式决定如何读取文件数据。
文件
文件是操作系统管理和存储数据的一种方式,Python
使用文件对象来处理文件。
文件类型
通常,文件可分为文本文件和二进制文件,Python
根据打开模式按文本文件或二进制文件格式读写文件中的数据。
- 文本文件根据字符编码保存文本,常见字符编码如
ASCII(默认编码)
、UTF-8(所有国家用的编码)
、GB2312
等;文本文件按字符读取文件,一个字符占用一个或多个字节;文本文件常用于保存字符组成的文本,整个文件可看作一个长字符串。 - 二进制文件存储的是数据的二进制代码(位0和位1),即将数据在内存中的存储形式复制到文件中;二进制文件没有字符编码,文件的存储格式与用途无关,二进制文件通常用于保存图片、音频和视频等数据。图片、音频和视频有不同的编码格式,如
png
格式的图片、mp3
格式的音频、mp4
格式的视频等;二进制文件通常按字节读取文件。
打开和关闭文件
使用Python
内置的open()
函数来打开文件,并返回其关联的文件对象,基本语法如下:
myfile = open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None) # 打开文件
注意:其中 file
、mode
、encoding
这 3 个参数比较重要
file
文件名,文件名可以是相对路径,也可以是绝对路径,省略路径时,Python
在当前工作目录中搜索文件encoding
文件编码,比如GBK
、UTF-8
、UTF-8-sig
等,有时候打开的文件会乱码,就需要使用这个参数处理mode
文件模式,默认是r
,即读模式
模式 | 解释 | 模式 | 解释 |
| 只读方式打开文件,默认模式 |
| 二进制读写模式 |
| 新建一个文件用于写入,如果文件已经存在则会覆盖旧文件 |
| 按文本格式读写文件数据,默认方式 |
| 追加模式,打开一个文件用于追加,如果该文件不存在则创建新文件 |
| 组合读写模式,同时进行读、写操作 |
| 创建新文件,如果文件存在则报错 |
1.第一步:使用程序打开一个文件hello.txt,调用函数写入三行文本,hello hello world hello python
第二步:读取写入的内容到内存中进行替换,把 hello 换成 你好写入到另一个文件 hi.txt
写一个程序把D:\WorkSpace\Cenos-7-x86_64-DVD-1810.iso 复制到
D:\WorkSpace\pythonProject
作业:
# 解析拉勾网数据文件,提取所需数据维度信息
# 岗位名称 positionName
# 城市 city
# 薪资范围 salary
# 福利待遇 companyLabelList
# 技能要求 skillLables
# 学历要求 education
# 工作经验 workYear
保存 CSV 格式 ,