本章概述:
- 7.1 文件的使用
- 7.2 实例11: 自动轨迹绘制
- 7.3 一维数据的格式化和处理
- 7.4 二维数据的格式化和处理
- 7.5 模块6: wordcloud库的使用
- 7.6 实例12: 政府工作报告词云
学完本章,你会掌握:
方法论
- 从Python角度理解的文件和数据表示
实践能力
- 学会编写带有文件输入输出的程序
一、文件的类型
1、文件的理解
文件是数据的抽象和集合
- 文件是存储在辅助存储器上的数据序列
- 文件是数据存储的一种形式
- 文件展现形态:文本文件和二进制文件
文本文件 vs. 二进制文件
- 文件文件和二进制文件只是文件的展示方式
- 本质上,所有文件都是二进制形式存储
- 形式上,所有文件采用两种方式展示
2、文本文件
文件是数据的抽象和集合
- 由单一特定编码组成的文件,如UTF-8编码
- 由于存在编码,也被看成是存储着的长字符串
- 适用于例如:.txt文件、.py文件等
3、二进制文件
文件是数据的抽象和集合
- 直接由比特0和1组成,没有统一字符编码
- 一般存在二进制0和1的组织结构,即文件格式
- 适用于例如:.png文件、.avi文件等
example:
以文本形式和二进制形式打开文件:
f.txt文件保存: "中国是个伟大的国家!"
#文本形式打开文件
tf = open("f.txt", "rt")
print(tf.readline())
tf.close()
>>>
中国是个伟大的国家!
#二进制形式打开文件
bf = open("f.txt", "rb")
print(bf.readline())
bf.close()
>>>
b'\xd6\xd0\xb9\xfa\xca\xc7\xb8\xf6\xce\xb0
\xb4\xf3\xb5\xc4\xb9\xfa\xbc\xd2\xa3\xa1'
二、文件的打开和关闭
文件处理的步骤: 打开-操作-关闭
文件的两个状态:存储状态和占用状态,相互转换:
常用的读文件函数:
a.read(size)
a.readline(size)
a.readlines(hint)
常用的写文件函数:
a.write(s)
a.writelines(lines)
a.seek(offset)
文件的打开:
文件路径:
假设一文件存储路径为:D:\PYE\f.txt
那么其以绝对路径打开方式有两种:
"D:/PYE/f.txt"
"D:\\PYE\\f.txt"
如果打开文件与程序同目录可省路径,使用相对路径打开方式:
"f.txt"
"./PYE/f.txt"
打开模式
example:
文件的关闭
注:如果没有f.close(),Python也会在程序运行结束后,自动关闭文件,但是最好不要忘记手动关闭文件。
三、文件内容的读取
1、文本读取函数和方法
2、文件的全文本操作
遍历全文本:方法一
fname = input("请输入要打开的文件名称:")
fo = open(fname,"r")
txt = fo.read()
#对全文txt进行处理
fo.close()
特点:一次读入,统一处理
遍历全文本:方法二
fname = input("请输入要打开的文件名称:")
fo = open(fname,"r")
txt = fo.read(2)#每次只读取2个字节
while txt != "":
#对txt进行处理
txt = fo.read(2)
fo.close()
特点:按数量读入,逐步处理
3、文件的逐行操作
逐行遍历文件:方法一
fname = input("请输入要打开的文件名称:")
fo = open(fname,"r")
for line in fo.readlines():# fo.readlines()得到该文本以行方式生成的列表,每行是列表的一个元素
print(line)
fo.close()
特点: 一次读入,分行处理
逐行遍历文件:方法二
fname = input("请输入要打开的文件名称:")
fo = open(fname,"r")
for line in fo:
print(line)
fo.close()
特点: 分行读入,逐行处理
四、数据的文件写入
1、文件写入函数和方法
example:
fo = open("output.txt","w+")
ls = ["中国", "法国", "美国"]
fo.writelines(ls)
for line in fo:
print(line)
fo.close()
运行结果:生成相应文件和内容,可是并没有预期的输出,这是怎么回事呢
修改一下:
fo = open("output.txt","w+")
ls = ["中国", "法国", "美国"]
fo.writelines(ls)#当前文件处理指针在文件最后面,此时调到打印程序,也是从当前指针往后打印
fo.seek(0)#调整文件指针回到最开始
for line in fo:
print(line)
fo.close()
运行结果:
单元小结:
- 文件的使用方式:打开-操作-关闭
- 文本文件&二进制文件,open( , )和.close()
- 文件内容的读取:.read() .readline() .readlines()
- 数据的文件写入:.write() .writelines() .seek()