基础知识
-
文件是存储在辅存上的数据序列,可以包含任何数据内容
-
文件分为
文本文件
+二进制文件
-
文本文件:单一特定编码,如utf-8,可以被看作是存储在磁盘上的长字符串
二进制文件:没有统一字符编码,如PNG格式的图片文件,avi格式的视频文件
文件处理步骤:打开-操作-关闭
文件处理类型
由文件的打开模式决定
'r'
只读,若文件不存在,返回FileNotFoundError
'w'
覆盖写,文件不存在则创建,存在则完全覆盖
'x'
创建写,文件不存在则创建,存在则返回FileExistsError
'a'
追加写,文件不存在则创建,存在则在文件最后追加内容
'b'
二进制形式,只读模式
't'
文本文件模式,只读模式
'+'
与r/w/x/a一同使用,在原功能基础上增加同时读写功能
# 示例
# 文本文件
tf = open("data.txt","rt")
tf.readline()
tf.close()
# 二进制文件
bf = open("data.txt","rb")
bf.readline()
bf.close()
read/readline/readlines的区别
file.read(size)
从文件中读入全部文件内容,如果给出参数size的值,则读入前size长度字符串或字节流
file.readline(size)
从文件中读入一行内容,如果给出参数,读入该行前size长度的字符串或字节流
file.readlines(size)
从文件中读入所有行,以每行为元素形成一个列表
# *****遍历全文本方法一:一次读入,统一处理*****
fname = input("请输入文件名")
f = open(fname,"r")
txt = f.read()
#对全文txt进行处理
f.close()
# *****遍历全文本方法二:按数量读入,逐步处理*****
fname = input("请输入文件名")
f = open(fname,"r")
txt = f.read(2)
while txt != "":
# 对txt进行处理
txt = f.read(2)
f.close()
# *****逐行遍历文件方法一:一次读入,分行处理*****
fname = input("请输入文件名")
f = open(fname,"r")
for line in f.readlines():
#对每行进行处理
f.close()
# *****逐行遍历文件方法二:分行读入,逐行处理*****
fname = input("请输入文件名")
f = open(fname,"r")
for line in f:
# 对每行进行处理
f.close()
seek改变位置
改变当前文件操作指针的位置file.seek(offset,from)
offset
文件指针偏移量
from
0表示文件开头(默认值),1表示当前位置,2表示文件结尾
>>> file.seek(0)
举个栗子
Example
读唐诗.txt文件,新建TangShi文件夹,在其中为每位诗人建立一个文件夹,并为每首诗建立一个文本文件、放入该诗人对应的文件夹中
import os
fs = open("./"+"唐诗.txt","r")
# 创建TangShi文件夹
if not os.path.exists("./TangShi"):
os.mkdir("./TangShi")
# 遍历txt文件,按行分析
for row in fs:
# 判断当前行是不是标题行
if row[0:3].isnumeric() and ":" in row:
# 分割,得到诗人名,诗词名
pos = row.find(":")
shiren = row[3:pos]
shici = row[pos+1:-1]
# 创建诗人文件夹
path_shiren = os.path.join("./TangShi",shiren)
if not os.path.exists(path_shiren):
os.mkdir(path_shiren)
# 创建诗词.txt
path_shici = path_shiren + "\\" + shici + ".txt"
fd = open(path_shici,'a')
#写入文件
fd.write(row)
fs.close()
fd.close()