文章目录
一、文件操作步骤
当我们要读取或者写入文件时,我们需要打开文件,在操作完毕时,我们需要关闭文件,以便释放和文件操作相关的系统资源。因此,文件操作的主要包括以下:
- 打开文件
- 读写等操作
- 关闭文件
注意:可以只打开和关闭文件,不进行任何读写操作。
二、文件的读写操作
1、文件的打开
在Python中,使用open( )
函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下:
# 文档中语法如下
open(file, mode='r', buffering=-1, encoding_=None, errors=None, newline=None, closefd=True, opener=None)
# 我们可以看到这个open( )函数有很多的参数
# 但是我们也可以看到处了第一个参数,其他的都是关键字参数
# 也就是说,除了第一个必填,其他的都可以不填写。
# 但是我们在实际开发中,比较常用的就是前两个选项。
open(name, mode)
name
:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。mode
:设置打开文件的模式(访问模式):只读、写入、追加等。
2、打开文件模式
在Python中,文件的打开模式如下表:
模式 | 描述 |
---|---|
r | 以只读方式打开文件。文件的指针将会放在文件的开头(相当于光标所在的位置)。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。(文件指针在开头,覆盖文件) |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
w+ | 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。(文件指针在内容的结尾处,方便追加内容) |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
说明:
主要的三种打开模式为
r
、w
、a
。
- 凡事带
+
都是可读可写模式。- 凡事带
b
的都是以二进制格式打开文件。- 所有的访问模式的基础特点都要遵循三种猪访问模式
r
、w
、a
。
x
模式
x
模式用来新建文件,如果文件不存在则创建,存在则报错。如果想创建一个文件,不想覆盖已有的文件,就可以选择这个操作文件的方式。
b
和t
t
是以纯文本方式打开文件,默认就是t
。b
是以二进制方式打开文件。
关于打开文件模式的官方文档,在[The Python Standard Library] —> [Built-in Functions] —> 内置方法列表中选择[open()]。
如下图:
3、获取一个文件对象
也就是打开一个文件。
# open()函数返回一个对象,这个对象就代表了当前打开的文件。
# file_obj是一个文件对象,文件打开状态
file_name= 'test.txt'
file_obj = open(file_name, 'r')
# <class '_io.TextIOWrapper'>
print(type(file_obj))
# <_io.TextIOWrapper name='test.txt' mode='r' encoding='cp936'>
print(file_obj)
注意:此时的
file_obj
是open( )
函数返回的文件对象。
只要没有报错,就证明文件打开了。
当我们获取了文件对象以后,所有的对文件的操作都应该通过对象来进行。
4、关于文件路径
-
如果目标文件和当前文件在同一级目录下,则直接使用文件名即可。
-
可以使用
..
来返回一级目录,也就是上一级目录。 -
在windows系统使用路径时,可以使用
/
来代替\
,在Python中会自动转换,或者可以使用
\\
来代替\
,或者也可以使用原始字符串,如
file_name = r'hello\demo.txt'
。也就是在字符串前面加上一个小写的
r
,是字符串原样输出,不加任何转义。 -
如果目标文件距离当前文件比较远,此时可以使用绝对路径。
绝对路径应该从磁盘的根目录开始书写,如
file_name = r'C:\Users\123\Desktop\hello.txt'
5、文件对象方法
(1)写方法
语法
对象对象.write('内容')
示例
# 1. 打开文件
f = open('test.txt', 'w')
# 2.文件写入
f.write('hello world')
# 3. 关闭文件
# 只要控制台显示Process finished with exit code 0
# 证明进程已经结束,代码执行完成。
f.close()
注意:
w
和a
模式:如果文件不存在则创建该文件;如果文件存在,w
模式先清空再写入,a
模式直接末尾追加。r
模式:如果文件不存在则报错。
练习说明
"""
测试目标
1. 访问模式对文件的影响
2. 访问模式对write()的影响
3. 访问模式是否可以省略
"""
# 访问模式参数可以省略, 如果省略表示访问模式为r(只读)
"""
1.r-只读模式打开文件:
1.1如果文件不存在,报错。
1.2不支持写入操作,表示只读。
"""
# 如果文件不存在,报错
# 结果:FileNotFoundError: [Errno 2] No such file or directory: 'test.txt'
f = open('test.txt', 'w')
# 文件存在,但不支持写入操作,表示只读。
f = open('test.txt', 'r')
# io.UnsupportedOperation: not writable
f.write('aa')
f.close()
"""
2.w-写入模式打开文件:
2.1如果文件不存在,新建文件
2.2执行写入,会覆盖原有内容
"""
# 文件存在则直接打开文件,文件不存在则创建该文件
f = open('1.txt', 'w')
# 写入内容直接覆盖原文件内容。
f.write('bbb')
f.close()
"""
3.a-添加模式打开文件:
3.1如果文件不存在,新建文件
3.2在文件原有内容基础上,追加新内容
"""
# 文件存在则直接打开文件,文件不存在则创建该文件
f = open('2.txt', 'a')
# 在文件原有内容基础上,追加新内容
f.write('xyz')
f.close()
"""
4.运行一次程序,write()方法会可以分多次向文件中写入内容
一次运行中,重复的调用write()向文件中写入内容,
不会进行覆盖。
单独调用两次,第二次的内容会覆盖第一次的内容。
`with...as...`写法看 <6、关闭>中有讲解
"""
file_name = 'demo.txt'
with open(file_name, 'w', encoding='utf-8') as file_obj:
file_obj.write('aaa\n')
file_obj.write('bbb\n')
file_obj.write('ccc\n')
"""
文件内容:
aaa
bbb
ccc
"""
"""
5.write('内容')方法中的内容,只能是字符串,
如果向输入一个数值型,需要进行类型转换,否则会报错:
TypeError: write() argument must be str, not int
"""
# 代码片段如下:
file_obj.write(str(123))
"""
6.write()方法有返回值,
会返回写入的字符的个数
"""
# 代码片段如下:
r = file_obj.write('今天天气真不错')
print(r) # 7
(2)读方法
read( )
read( )
方法,用来读取文件中的内容,它会将内容全部保存为一个字符串返回。
文件对象.read(num)
num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。
示例:
"""
文件内容如果有换行,底层是\n换行,会占用1个字节,
导致read()方法填写的参数与读取出来的数据不匹配.
"""
f = open('test.txt', 'r')
# read不写参数表示读取所有;
# print(f.read())
print(f.read(10))
f.close()
readlines( )
readlines( )
方法可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据(包括换行符)为一个元素。
f = open('test.txt')
content = f.readlines()
# ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc']
print(content)
# 关闭文件
f.close()
readline( )
readline( )
方法一次读取一行内容。
f = open('test.txt') # 只读方式打开
# 第一次调用`readline( )`方法方法,即读取文件第一行内容
content = f.readline()
print(f'第一行:{content}')
# 第二次调用`readline( )`方法方法,即读取文件第二行内容
# 以此类推
content = f.readline()
print(f'第二行:{content}')
# 关闭文件
f.close()
"""
输出结果:
第一行:abcde
第二行:12345
"""
for循环方式读取文件内容
# 定义文件名
file_name = 'demo.txt'
# 循环读取文件内容,变量t就文件内的一行内容
# 遍历一次,读取一行。
with open(file_name, encoding='utf-8') as file_obj:
for t in file_obj:
print(t)
注意:
我们上边的练习都是以只读的方法打开文件,然后在读取数据。以只读的方式打开文件,光标默认是在文件的开头,所致使用read()
等方法我们能看到读取的结果。
但是写入的方式打开文件如w
,a
:
-
w
:打开文件后,光标是在文件的开头,但是以w
方式打开文件会自动清空文件数据,所以我们在调用读取方法,我们依然看不到任何数据。 -
a
:打开文件后,光标是在文件内容的末尾的,所以我们在调用读取方法,我们也依然会看不到任何数据。
(3)seek()
打开文件后,文件指针的位置会影响读取文件的数据。
seek()
方法的作用:用来移动文件指针。
语法如下:
文件对象.seek(偏移量, 起始位置)
起始位置:
- 0:文件开头
- 1:当前位置
- 2:文件结尾
示例:
"""
语法: 文件对象.seek(偏移量, 起始位置)
0开头 1当前 2结尾
偏移量:要切换到的位置
"""
# 示例1:r打开文件
# 改变读取数据开始位置
f = open('test.txt', 'r+')
# 1.改变读取数据开始位置,开头偏移两位
f.seek(2, 0)
# 2.文件指针放到内容结尾
# f.seek(0, 2)
# 读取文件
con = f.read()
print(con)
# 关闭文件
f.close()
"""
输出结果
cde
12345
abcde
abcde
"""
# 示例2:a打开文件
f = open('test.txt', 'a+')
# 文件指针放到文件开头
# 当参数为两个0的时候,可以简写成一个0
# 表示不偏移,起始位置是开头。
# f.seek(0, 0)
# f.seek(0)
# 读取文件
con = f.read()
print(con)
# 关闭文件
f.close()
"""
输出结果:
abcde
12345
abcde
abcde
"""
# 示例3.可以只写偏移量,
# 起始位置默认是0,开头
file_obj.seek(55)
# 从开头向后偏移80位
# file_obj.seek(80,0)
# 从当前位置向后偏移70位
# file_obj.seek(70,1)
# io.UnsupportedOperation: can't do nonzero end-relative seeks
# file_obj.seek(-10,2)
(4)tell()
# tell() 方法用来查看当前读取的位置(光标的位置)
示例
with open('demo2.txt','rt' , encoding='utf-8') as file_obj:
# print(file_obj.read(100))
# print(file_obj.read(30))
# seek() 可以修改当前读取的位置
# 中文一个字符代表三个字节,截取两个字节打印就会报错
file_obj.seek(9)
# seek()需要两个参数
# 第一个 是要切换到的位置
# 第二个 计算位置方式
# 可选值:
# 0 从头计算,默认值
# 1 从当前位置计算
# 2 从最后位置开始计算
print(file_obj.read())
# tell() 方法用来查看当前读取的位置
print('当前读取到了 -->',file_obj.tell())
6、关闭
文件对象.close()
而我们在工作中对文件的标准处理格式为使用with...as...
# with ... as 语句用法
"""
#with open(file_name) as file_obj 和 file_obj = open(file_name) 是一样的
#open(file_name)的返回值赋值给了file_obj
with open(file_name) as file_obj :
# 在with语句中可以直接使用file_obj来做文件操作
# 此时这个文件只能在with中使用,一旦with结束则文件会自动close()
print(file_obj.read())
"""
标准写法
# 确定文件名
file_name = 'hello'
try:
# 打开文件
with open(file_name) as file_obj :
# 对文件进行处理
print(file_obj.read())
except FileNotFoundError:
# 文件不存在进行异常处理
print(f'{file_name} 文件不存在~~')
7、综合练习:读取大文件
需求:读取大文件
# 确定文件名
file_name = 'demo.txt'
try:
# 调用open()方法来打开一个文件,可以将文件分成两种类型
# 一种,是纯文本文件(使用utf-8等编码编写的文本文件)
# 一种,是二进制文件(图片、mp3、ppt等这些文件)
# open()方法打开文件时,默认是以文本文件的形式打开的,
# 但是open()方法默认的编码为None,
# 所以处理文本文件时,必须要指定文件的编码。
with open(file_name,encoding='utf-8') as file_obj:
# 通过 read() 来读取文件中的内容
# 如果直接调用read()它会将文本文件的所有内容全部都读取出来,
# 如果要读取的文件较大的话,会一次性将文件的内容加载到内存中,
# 容易导致内存泄漏(溢出)。
# 所以对于较大的文件,不要直接调用read()方法读取文件。
#
# read()可以接收一个size作为参数,
# 该参数用来指定调用一次read()方法读取的字符的数量。
# 默认值为-1,它会读取文件中的所有字符。
# 可以为size指定一个值,这样read()方法会读取指定数量的字符,
# 每一次读取都是从上次读取到位置开始读取的,
# 如果字符的数量小于size,则会读取剩余所有的,
# 如果已经读取到了文件的最后了,则会返回''空串,
# content = file_obj.read(-1)
content = file_obj.read(6)
"""
这里可以换成上边循环的方法,读取内容,
也可以换成其他的读取方法。
# 定义一个变量,来指定每次读取的大小
chunk = 100
# 创建一个循环来读取文件内容
while True:
# 读取chunk大小的内容
content = file_obj.read(chunk)
# 检查是否读取到了内容
# content 空串为false
if not content:
# 内容读取完毕,退出循环
break
# 输出内容
# print(content,end='')
"""
except FileNotFoundError :
print(f'{file_name} 这个文件不存在!')