文件
1.定义:
是数据的抽象和集合
- 存储在辅助存储器上的数据序列
- 数据存储的一种形式
- 文件展现形态:文本文件和二进制文件
- 本质上,所有的文件都是二进制形态存储,形式上,所有文件采用两种方式展示
2.文本文件
-文本文件
由单一特定编码组成的文件,如UTF-8编码
由于存在编码,也被看成是存储着的长字符串
适用于例如:txt文件、.py文件
-表现形式
例1:
“中国是个伟大的国家!”
“中国是个伟大的国家!”
例2:
f.txt文件保存:”中国是个伟大的国家!”
#文本形式打开文件
tf = open(“f.txt”,”rt”)
print(tf.readline())
tf.close
中国是个伟大的国家!
3.二进制文件
- 直接由比特0和1组成,没有统一字符编码
- 一般存在二进制0和1的组织结构,即文件格式
- 适用于例如:.png文件、.avi文件等
例1:
“中国是个伟大的国家!”
b’\xd6\xd0\xb9\xfa\xca\xc7\xb8\xf6\xce\xb0\xb4\xf3\xb5\xc4\xb9\xfa\xbc\xd2\xa3\xa1’
例2:
f.txt文件保存:”中国是个伟大的国家!”
#二进制形式打开文件
bf = open(“f.txt”,”rb”)
print(bf.readline())
bf.close()
b’\xd6\xd0\xb9\xfa\xca\xc7\xb8\xf6\xce\xb0\xb4\xf3\xb5\xc4\xb9\xfa\xbc\xd2\xa3\xa1’
4.文件的打开
常用形式
open() 函数常用形式是接收两个参数:文件名(file)和模式(mode),
使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。
<变量名> = open(file, mode)
<变量名> :文件句柄
file:文件路径和名称 (和源文件同目录可省略路径)
例:
“D:/PYE/f.txt”
“f.txt”
mode:文本or 二进制,读 or 写。为空时默认文本或二进制形式、只读模式
完整的语法格式为:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
•file: 必需,文件路径(相对或者绝对路径)和名称
•mode: 可选,文件打开模式(默认文本或二进制形式、只读模式),读或写
•buffering: 设置缓冲
•encoding: 一般使用utf8
•errors: 报错级别
•newline: 区分换行符
•closefd: 传入的file参数类型
•opener:
打开模式mode
- ‘t’ 文本文件模式,默认值
- ‘b’ 二进制文件模式,默认值
- ‘r’ 只读模式,文件的指针将会放在文件的开头。默认模式,如果文件不存在,返回报错FileNotFoundError
-‘rb’ 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。模式模式。一般用于非文本如图片等。 - ‘x’ 创建写模式,文件不存在则创建新文件,存在则返回报错FileExistsError
- ‘w ’ 覆盖写模式,打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
- ‘wb ’ 覆盖写模式,以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,则创建文件。
- ‘a’ 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
- ‘ab’ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
- ‘+’ 与r/w/x/a一同使用,在原功能基础上增加同时读写功能
- ‘U’ 通用换行模式(不推荐)
-默认以文本模式,如果要以二进制模式打开,加上b。
5.文件内容的读取
.read([size] ) 从整个文件读取指定前size的字节数,如果未给定或为负则读取所有
例1:
s = f.read(-1)
中国是个伟大的国家!
例2:
s = f.read(2)
中国
.readline([size]) 读入一整行内容,包括”\n”字符,如果给出参数,读入该行前size长度
例1:
s = f.readline()
中国是个伟大的国家!
例2:
s = f.readline(2)
中国
.readlines([sizeint]) 读取所有行并以每行为元素形成列表,若给定sizeint>0,返回读入前sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。
例1:
s = f.readline()
[中国是个伟大的国家!]
例2:
s = f.readline(1)
[中国是个伟大的国家!]
6.遍历全文本
一次读入,统一处理
例:
fname = input(“请输入要打开的文件名称:”)
fo =open(fname,”r”) #和源文件同目录可省略路径,省略文件路径
txt = fo.read() #对全文txt进行处理
fo.close
按字节数量读入,逐步处理
例:
fname = input(“请输入要打开的文件名称:”)
fo = open(fname,”r”)
txt = fo.read(2)
while txt != “”:
txt = fo.read(2) #按两个字节,依次读入
fo.close()
一次读入,分行处理
例:
fname = input(“请输入要打开的文件名称:”)
fo = open(fname,”r”)
for line in fo.readlines(): #读取所有行并以每行为元素形成列表
print(line)
fo.close()
分行读入逐行处理
例:
fname = input(“请输入要打开的文件名称:”)
fo = open(fname,”r”)
for line in fo:
print(line)
fo.close()
7.数据的文件写入
.write(s) 向文件写入一个字符串或字节流,返回的是写入的字符长度
例:
f.write(“中国是一个伟大的国家!”)
.writelines(lines) 将一个元素全为字符串的列表写入文件,如果需要换行则要自己加入每行的换行符
例:
ls = [“中国”,”法国”,”美国”]
f.writelines(ls)
中国法国美国
.seek(offset) 改变当前文件操作指针的位置,
offset含义如下:
0 – 文件开头
1 – 当前位置
2 – 文件结尾
例:
f.seek(0) # 调整文件操作指针回到文件开头
<f>.tell() 返回当前文件操作指针的位置
<f>.flush() 刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件,而不是被动的等待输出缓冲区写入。一般情况下,文件关闭后会自动刷新缓冲区,但有时你需要在关闭前刷新它,这时就可以使用 flush() 方法。
例:
fo = open(“runoob.txt”,”wb”) #打开文件
fo.flush() #刷新缓冲区
fo.close() #关闭文件
.fileno() 返回一个整型的文件描述符(file desciptor FD整型),可以用在如os模块的read方法等一些底层操作上。
例:
fo = open("runoob.txt", "wb") # 打开文件
print ("文件名为: ", fo.name)
fid = fo.fileno() #返回一个整型的文件描述符
print ("文件描述符为: ", fid)
fo.close() # 关闭文件
文件名为: runoob.txt
文件描述符为: 3
.isatty() 如果文件连接到一个终端设备返回True ,否则返回False
例:
fo = open("runoob.txt", "wb") # 打开文件
print ("文件名为: ", fo.name)
ret = fo.isatty()
print ("连接了设备: ", ret)
fo.close() # 关闭文件
文件名为: runoob.txt
连接了设备: False
.truncate([size]) 从文件的首字符开始截断,截断文件为size个字符,截断之后后面的所有字符被删除,其中Widnows系统下的换行代表2个字符大小。
如果没有指定size,则重置文件操作指针到当前位置,并取消截取操作。
文件 runoob.txt 的内容如下:
1:www.runoob.com
2:www.runoob.com
3:www.runoob.com
例1:
fo = open("runoob.txt", "r+") # 打开文件
print ("文件名为: ", fo.name)
line = fo.readline()
print ("读取行: %s" % (line))
fo.truncate() #从当前位置截断
line = fo.readlines()
print ("读取行: %s" % (line))
fo.close() #关闭文件
文件名为: runoob.txt
读取行: 1:www.runoob.com
读取行: ['2:www.runoob.com\n', '3:www.runoob.com\n']
例2:
fo = open("runoob.txt", "r+") # 打开文件
print ("文件名为: ", fo.name)
fo.truncate(10) # 截取10个字节
str = fo.read()
print ("读取数据: %s" % (str))
fo.close() # 关闭文件
文件名为: runoob.txt
读取数据: 1:www.runo #截取10个字节后,直接删除后面字符
在”w+”模式下数据的文件写入
例1:
fo = open(“output.txt”,”w+”)
ls = [“中国”,”法国”,”美国”]
fo.writelines(ls) #将一个元素全为字符串的列表写入文件
for line in fo:
print(line) #逐行读取输出
fo.close()
#没有任何输出
例2:
fo = open(“output.txt”,”w+”)
ls = [“中国”,”法国”,”美国”]
fo.writelines(ls)
fo.seek(0) #调整文件操作指针回到文件开头
for line in fo:
print(line)
fo.close()
中国法国美国
.8文件的关闭
<变量名>.close()
- <变量名> 文件句柄
9.文件处理的步骤:
打开 – 操作 – 关闭
a = open( , )
a.close()
#操作中考虑:文件的存储状态,文件占用状态等