基础知识
-
文件是存储在辅存上的数据序列,可以包含任何数据内容
-
文件分为
文本文件+二进制文件 -
文本文件:单一特定编码,如utf-8,可以被看作是存储在磁盘上的长字符串
二进制文件:没有统一字符编码,如PNG格式的图片文件,avi格式的视频文件
文件处理步骤:打开-操作-关闭

文件处理类型
由文件的打开模式决定
'r'只读,若文件不存在,返回FileNotFoundError
'w'覆盖写,文件不存在则创建,存在则完全覆盖
'x'创建写,文件不存在则创建,存在则返回FileExistsError
'a'追加写,文件不存在则创建,存在则在文件最后追加内容
'b'二进制形式,只读模式
't'文本文件模式,只读模式
'+'与r/w/x/a一同使用,在原功能基础上增加同时读写功能
# 示例
# 文本文件
tf = open("data.txt","rt")
tf.readline()
tf.close()
# 二进制文件
bf = open("data.txt","rb")
bf.readline()
bf.close()
read/readline/readlines的区别
file.read(size)
从文件中读入全部文件内容,如果给出参数size的值,则读入前size长度字符串或字节流
file.readline(size)
从文件中读入一行内容,如果给出参数,读入该行前size长度的字符串或字节流
file.readlines(size)
从文件中读入所有行,以每行为元素形成一个列表
# *****遍历全文本方法一:一次读入,统一处理*****
fname = input("请输入文件名")
f = open(fname,"r")
txt = f.read()
#对全文txt进行处理
f.close()
# *****遍历全文本方法二:按数量读入,逐步处理*****
fname = input("请输入文件名")
f = open(fname,"r")
txt = f.read(2)
while txt != "":
# 对txt进行处理
txt = f.read(2)
f.close()
# *****逐行遍历文件方法一:一次读入,分行处理*****
fname = input("请输入文件名")
f = open(fname,"r")
for line in f.readlines():
#对每行进行处理
f.close()
# *****逐行遍历文件方法二:分行读入,逐行处理*****
fname = input("请输入文件名")
f = open(fname,"r")
for line in f:
# 对每行进行处理
f.close()
seek改变位置
改变当前文件操作指针的位置file.seek(offset,from)
offset文件指针偏移量
from0表示文件开头(默认值),1表示当前位置,2表示文件结尾
>>> file.seek(0)

举个栗子
Example读唐诗.txt文件,新建TangShi文件夹,在其中为每位诗人建立一个文件夹,并为每首诗建立一个文本文件、放入该诗人对应的文件夹中

import os
fs = open("./"+"唐诗.txt","r")
# 创建TangShi文件夹
if not os.path.exists("./TangShi"):
os.mkdir("./TangShi")
# 遍历txt文件,按行分析
for row in fs:
# 判断当前行是不是标题行
if row[0:3].isnumeric() and ":" in row:
# 分割,得到诗人名,诗词名
pos = row.find(":")
shiren = row[3:pos]
shici = row[pos+1:-1]
# 创建诗人文件夹
path_shiren = os.path.join("./TangShi",shiren)
if not os.path.exists(path_shiren):
os.mkdir(path_shiren)
# 创建诗词.txt
path_shici = path_shiren + "\\" + shici + ".txt"
fd = open(path_shici,'a')
#写入文件
fd.write(row)
fs.close()
fd.close()
309

被折叠的 条评论
为什么被折叠?



