1. 打开文件
- 文件(file) 通过Python程序来对计算机中的各种文件进行增删改查的操作 文件也叫I/O(Input/Output)
- 文件的操作步骤
- 打开文件
- 对文件进行各种操作(读、写)然后保存
- 关闭文件
- 文件会有一个返回值。返回一个对象,这个对象就表示的是当前的文件
- 如果目标文件和当前文件在同一级目录下,直接使用文件名即可;否则,需使用完整路径
2. 关闭文件
- 调用close()方法来关闭文件
-
read()函数 用来读取文件的内容,它会将内容全部保存到一个字符串返回
file_name = 'demo.txt'
file_obj = open(file_name)
#read()函数 用来读取文件的内容,它会将内容全部保存到一个字符串返回
content = file_obj.read()
print(content) #此处会打印出demo.txt的内容
# 调用close()函数来关闭文件
file_obj.close()
#此时demo.txt一被关闭,报错
file_obj.read() # ValueError: I/O operation on closed file.
- with…as 语句不用写close()来关闭。它自带关闭
with open(file_name) as file_obj:
print(file_obj.read()) #此处执行后,自动调用close语句关闭文件
print(file_obj.read()) #ValueError: I/O operation on closed file.
3. 读取文件
3.1 读取文件简介
- 通过read()来读取文件的内容
- 调用 open (file, mode=‘r’, buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None),来打开一个文件,可以将文件分为2种类型
- 一种 纯文本文件(使用utf-8编码等编写的文件)
- 若打开的纯文本是纯英文,则encoding无需传参,因ASCII码能直接处理英文。
- 若纯文本有中文,则encoding=utf-8传入)
- 一种 二进制文件(图片 mp3 视频…)
- 修改open()的 mode 值,默认为 mode = ‘rt’ / ‘wt’,t一般不写,为默认读取文本文件。所以若要打开或写入二进制文件,需要修改 mode = ‘rb’或 mode = ‘wb’,b 代表读取二进制文件
- 一种 纯文本文件(使用utf-8编码等编写的文件)
3.2 较大文件的读取
- 通过read()读取文件内容时会将文件中所有的内容全部读取出来。如果对于读取的文件比较大的话。会一次性的将文件加载到内容中。容易导致内存泄露。所以对于较大的文件。不要直接调用read()
- read()可以接收一个size作为的参数。该参数用来指定要读取字符的数量。默认值为-1.-1也就是要读取全部的内容
- 每次读取都会从上次读取到的位置开始。如果字符的数量小于size。则会读取所有的。如果读取到最后的文件。则会返回空串
file_name = 'demo.txt'
try:
with open(file_name,encoding='utf-8') as file_obj:
# 定义一个变量 来保存结果
file_content = ''
# 定义一个变量 指定每次读取的大小
chunk = 100
# 创建一个循环来读取内容
while True:
content = file_obj.read(chunk)
# 检查是否读完文件
if not content:
# 内容读取完毕退出循环
break
# print(content,end='')
file_content += content
print(file_content)
- readline() 该方法用来读取一行
- readlines() 该方法用于一行一行的读取内容,它会一次性将读取内容封装到一个列表当中返回
4. 文件的写入
- 使用open()函数打开文件时,必须要指定打开文件要做的操作(读、写、追加)。如果不指定操作类型,则默认是读取文件,而读取文件是不能向文件中写入
- write()来向文件中写入内容
- 该方法可以分多次向文件写入内容
- 写入完成之后该方法会返回写入的字符的个数
file_name = 'demo4.txt'
with open(file_name,'x’,encoding='utf-8') as file_obj:
# write()来向文件中写入内容
# 如果操作的是一个文本文件的时候,则需要传递一个字符串作为参数
# r表示只读
# w表示可以写,如果文件存在,则覆盖文件内务;若无,则创建新的
# a表示追加
# x 表示用来创建新的文件,如有文件不存在则创建,如果存在就报错
# FileExistsError: [Errno 17] File exists: 'demo.txt'
# file_obj.write('nice to meet you')
# 若参数没有修改为‘w’,则默认为‘r’制度模式,会报错
#io.UnsupportedOperation: not writable
file_obj.write('abc\n')
file_obj.write('def')
file_obj.write('wxy')
r = file_obj.write(str(123)+'\n')
# write()有返回值,返回写入的字符的个数
# TypeError: write() argument must be str, not int
print(r)
5. 二进制文件的读取
- 修改open()的 mode 值,默认为 mode = ‘rt’ / ‘wt’,t一般不写,为默认读取文本文件。所以若要打开或写入二进制文件,需要修改 mode = ‘rb’或 mode = ‘wb’,b 代表读取二进制文件
file_name = r'C:\Users\9100F-7\Desktop\Kalimba.mp3'
# 读取模式
# t 读取文本文件(默认值)
# b 读取二进制文件
with open(file_name,'rb') as file_obj:
# 若没有修改 mode = ‘rb’,则 mode默认为 ‘rt’,报错
# print(file_obj.read(100)) # UnicodeDecodeError: 'gbk' codec can't decode byte 0xd1 in position 165: illegal multibyte sequence
# 将读取到的内容写出来
# 定义一个新的文件
new_name = 'abc.mp3'
with open(new_name,'wb') as new_obj:
# 定义每次读取的大小
chuck = 1024 * 100
while True:
# 读取数据
content = file_obj.read(chuck)
# 判断是否读取完毕
if not content:
break
# 将内容写到新的文件当中
new_obj.write(content)