Python 文件操作是 Python 编程中一个非常基本且重要的部分。它允许你读取、写入、追加以及删除文件中的数据。Python 通过内置的 open()
函数来打开一个文件,并返回一个文件对象。然后,你可以使用这个文件对象的方法来执行不同的文件操作。
打开文件
使用 open()
函数打开文件。这个函数的基本语法是:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
file
:要打开的文件名或路径。mode
:打开文件的模式,默认为 ‘r’(只读)。其他常用模式包括 ‘w’(只写,文件不存在则创建,存在则覆盖)、‘a’(追加,文件不存在则创建)、‘r+’(读写)、‘w+’(读写,文件不存在则创建,存在则覆盖)、‘a+’(读写,文件不存在则创建,写入时追加)。
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
---|---|
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除。如果该文件不存在,创建新文件。 |
a | 打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
encoding
:用于指定文件的编码格式,如 ‘utf-8’。
f = open('python.txt', 'r', encoding=”UTF-8)
# encoding的顺序不是第三位,所以不能用位置参数,用关键字参数直接指定
读取文件
打开文件后,可以使用文件对象的 read()
方法来读取文件内容。
1.文件对象.read(num)
#num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。
2.文件对象.readlines()
#readlines可以按照行的方式把整个文件中的内容进行一次性读取,
#并且返回的是一个列表,其中每一行的数据为一个元素。
f = open('python.txt')
content = f.readlines()
# ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc']
print(content)
# 关闭文件
f.close()
3.文件对象.readline()
#一次读取一行内容
f = open('python.txt')
content = f.readline()
print(f'第一行:{content}')
content = f.readline()
print(f'第二行:{content}')
# 关闭文件
f.close()
with open('example.txt', 'r', encoding='utf-8') as file:
content = file.read()
print(content)
# 通过在with open的语句块中对文件进行操作
# 可以在操作完成后自动关闭close文件,避免遗忘掉close方法
操作汇总
操作 | 功能 |
---|---|
文件对象 = open(file, mode, encoding) | 打开文件获得文件对象 |
文件对象.read(num) | 读取指定长度字节不指定num读取文件全部 |
文件对象.readline() | 读取一行 |
文件对象.readlines() | 读取全部行,得到列表 |
for line in 文件对象 | for循环文件行,一次循环得到一行数据 |
文件对象.close() | 关闭文件对象 |
with open() as f | 通过with open语法打开文件,可以自动关闭 |
写入文件
使用 write()
方法可以向文件写入内容。如果文件不存在,将会被创建(前提是打开模式允许)。
# 1. 打开文件
f = open('python.txt', 'w')
# 2.文件写入
f.write('hello world')
# 3. 内容刷新
f.flush()
直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区
当调用flush的时候,内容会真正写入文件
这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)
•文件如果不存在,使用”w”模式,会创建新文件
•文件如果存在,使用”w”模式,会将原有内容清空
追加文件
a模式,文件不存在会创建文件
a模式,文件存在会在最后,追加写入文件
# 1. 打开文件,通过a模式打开即可
f = open('python.txt', 'a')
# 2.文件写入
f.write('hello world')
# 3. 内容刷新
f.flush()
逐行读取
对于大文件,一次性读取整个文件可能不现实。可以使用 readline()
方法逐行读取,或者使用 for
循环遍历文件对象(它会自动处理换行符)。
with open('example.txt', 'r', encoding='utf-8') as file:
for line in file:
print(line, end='') # end='' 用于防止打印额外的换行符
上下文管理器(with
语句)
with
语句是一种上下文管理器,它会在代码块执行完毕后自动帮你关闭文件,这是一种很好的做法,因为它可以避免文件未关闭带来的潜在问题。
注意事项
- 确保文件路径正确,尤其是当文件不在当前工作目录时。
- 处理文件时,注意文件的打开模式,避免数据丢失。
- 使用
with
语句来自动管理文件的打开和关闭。 - 对于大型文件,考虑使用逐行读取或分块读取的方式。
通过这些基本的文件操作,你可以在 Python 中进行复杂的文件处理任务。