【无为则无心&Python基础】— 52、Python中文件的读写操作

最新推荐文章于 2022-02-10 21:51:00 发布

Liuyuelinjiayou

最新推荐文章于 2022-02-10 21:51:00 发布

阅读量894

点赞数

分类专栏： Python基础文章标签： python 编程语言软件测试

本文链接：https://blog.csdn.net/Liuyuelinjiayou/article/details/105743830

版权

Python基础专栏收录该内容

75 篇文章 8 订阅

订阅专栏

本文详细介绍了Python中文件操作的步骤，包括打开、读写和关闭文件。重点讲解了文件的打开模式，如读、写、追加，以及二进制模式。此外，还讨论了文件对象的方法，如写入、读取和文件指针的移动。最后，提到了在处理大文件时的注意事项。

摘要由CSDN通过智能技术生成

一、文件操作步骤

当我们要读取或者写入文件时，我们需要打开文件，在操作完毕时，我们需要关闭文件，以便释放和文件操作相关的系统资源。因此，文件操作的主要包括以下：

打开文件
读写等操作
关闭文件

注意：可以只打开和关闭文件，不进行任何读写操作。

二、文件的读写操作

1、文件的打开

在Python中，使用open( )函数，可以打开一个已经存在的文件，或者创建一个新文件，语法如下：

# 文档中语法如下
open(file, mode='r', buffering=-1, encoding_=None, errors=None, newline=None, closefd=True, opener=None)

# 我们可以看到这个open( )函数有很多的参数
# 但是我们也可以看到处了第一个参数，其他的都是关键字参数
# 也就是说，除了第一个必填，其他的都可以不填写。
# 但是我们在实际开发中，比较常用的就是前两个选项。

open(name, mode)

name：是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。
mode：设置打开文件的模式(访问模式)：只读、写入、追加等。

2、打开文件模式

在Python中，文件的打开模式如下表：

模式	描述
r	以只读方式打开文件。文件的指针将会放在文件的开头（相当于光标所在的位置）。这是默认模式。
rb	以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+	打开一个文件用于读写。文件指针将会放在文件的开头。
rb+	以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w	打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。（文件指针在开头，覆盖文件）
wb	以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
w+	打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
wb+	以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
a	打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。（文件指针在内容的结尾处，方便追加内容）
ab	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
a+	打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。
ab+	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

说明：

主要的三种打开模式为r、w、a。

凡事带+都是可读可写模式。
凡事带b的都是以二进制格式打开文件。
所有的访问模式的基础特点都要遵循三种猪访问模式r、w、a。

x模式

x模式用来新建文件，如果文件不存在则创建，存在则报错。

如果想创建一个文件，不想覆盖已有的文件，就可以选择这个操作文件的方式。

b和t

t是以纯文本方式打开文件，默认就是t。
b是以二进制方式打开文件。

关于打开文件模式的官方文档，在[The Python Standard Library] —> [Built-in Functions] —> 内置方法列表中选择[open()]。

如下图：
在这里插入图片描述

3、获取一个文件对象

也就是打开一个文件。

# open()函数返回一个对象，这个对象就代表了当前打开的文件。
# file_obj是一个文件对象,文件打开状态
file_name= 'test.txt'
file_obj = open(file_name, 'r')

# <class '_io.TextIOWrapper'>
print(type(file_obj)) 
# <_io.TextIOWrapper name='test.txt' mode='r' encoding='cp936'>
print(file_obj)

注意：此时的file_obj是open( )函数返回的文件对象。

只要没有报错，就证明文件打开了。

当我们获取了文件对象以后，所有的对文件的操作都应该通过对象来进行。

4、关于文件路径

如果目标文件和当前文件在同一级目录下，则直接使用文件名即可。
可以使用..来返回一级目录，也就是上一级目录。
在windows系统使用路径时，可以使用/来代替\，在Python中会自动转换，

或者可以使用 \\ 来代替 \，

或者也可以使用原始字符串，如file_name = r'hello\demo.txt'。

也就是在字符串前面加上一个小写的r，是字符串原样输出，不加任何转义。
如果目标文件距离当前文件比较远，此时可以使用绝对路径。

绝对路径应该从磁盘的根目录开始书写，如file_name = r'C:\Users\123\Desktop\hello.txt'

5、文件对象方法

（1）写方法

语法

对象对象.write('内容')

示例

# 1. 打开文件
f = open('test.txt', 'w')

# 2.文件写入
f.write('hello world')

# 3. 关闭文件
# 只要控制台显示Process finished with exit code 0
# 证明进程已经结束，代码执行完成。
f.close()

注意：

w和a模式：如果文件不存在则创建该文件；如果文件存在，w模式先清空再写入，a模式直接末尾追加。
r模式：如果文件不存在则报错。

练习说明

"""
测试目标
1. 访问模式对文件的影响
2. 访问模式对write()的影响
3. 访问模式是否可以省略
"""

# 访问模式参数可以省略, 如果省略表示访问模式为r（只读）

"""
1.r-只读模式打开文件: 
1.1如果文件不存在，报错。
1.2不支持写入操作，表示只读。
"""
# 如果文件不存在，报错
# 结果：FileNotFoundError: [Errno 2] No such file or directory: 'test.txt'
f = open('test.txt', 'w')

# 文件存在，但不支持写入操作，表示只读。
f = open('test.txt', 'r')
# io.UnsupportedOperation: not writable
f.write('aa')  
f.close()


"""
2.w-写入模式打开文件：
2.1如果文件不存在，新建文件
2.2执行写入，会覆盖原有内容
"""
# 文件存在则直接打开文件，文件不存在则创建该文件
f = open('1.txt', 'w')
# 写入内容直接覆盖原文件内容。
f.write('bbb')
f.close()


"""
3.a-添加模式打开文件：
3.1如果文件不存在，新建文件
3.2在文件原有内容基础上，追加新内容
"""
# 文件存在则直接打开文件，文件不存在则创建该文件
f = open('2.txt', 'a')
# 在文件原有内容基础上，追加新内容
f.write('xyz')
f.close()


"""
4.运行一次程序，write()方法会可以分多次向文件中写入内容
一次运行中，重复的调用write()向文件中写入内容，
不会进行覆盖。
单独调用两次，第二次的内容会覆盖第一次的内容。

`with...as...`写法看 <6、关闭>中有讲解
"""
file_name = 'demo.txt'

with open(file_name, 'w', encoding='utf-8') as file_obj:
    file_obj.write('aaa\n')
    file_obj.write('bbb\n')
    file_obj.write('ccc\n')
"""
文件内容：
aaa
bbb
ccc
"""


"""
5.write('内容')方法中的内容，只能是字符串，
如果向输入一个数值型，需要进行类型转换，否则会报错：
TypeError: write() argument must be str, not int
"""
# 代码片段如下：
file_obj.write(str(123))

"""
6.write()方法有返回值，
会返回写入的字符的个数
"""
# 代码片段如下：
r = file_obj.write('今天天气真不错')
print(r)  # 7

（2）读方法

`read( )`

read( )方法，用来读取文件中的内容，它会将内容全部保存为一个字符串返回。

文件对象.read(num)

num表示要从文件中读取的数据的长度（单位是字节），如果没有传入num，那么就表示读取文件中所有的数据。

示例：

"""
文件内容如果有换行，底层是\n换行，会占用1个字节，
导致read()方法填写的参数与读取出来的数据不匹配.
"""
f = open('test.txt', 'r')

# read不写参数表示读取所有；
# print(f.read())
print(f.read(10))

f.close()

`readlines( )`

readlines( )方法可以按照行的方式把整个文件中的内容进行一次性读取，并且返回的是一个列表，其中每一行的数据（包括换行符）为一个元素。

f = open('test.txt')
content = f.readlines()

# ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc']
print(content)

# 关闭文件
f.close()

`readline( )`

readline( )方法一次读取一行内容。

f = open('test.txt')  # 只读方式打开

# 第一次调用`readline( )`方法方法，即读取文件第一行内容
content = f.readline()
print(f'第一行：{content}')

# 第二次调用`readline( )`方法方法，即读取文件第二行内容
# 以此类推
content = f.readline()
print(f'第二行：{content}')

# 关闭文件
f.close()

"""
输出结果：
第一行：abcde

第二行：12345
"""

for循环方式读取文件内容

# 定义文件名
file_name = 'demo.txt'

# 循环读取文件内容，变量t就文件内的一行内容
# 遍历一次，读取一行。
with open(file_name, encoding='utf-8') as file_obj:
    for t in file_obj:
        print(t)

注意：

我们上边的练习都是以只读的方法打开文件，然后在读取数据。以只读的方式打开文件，光标默认是在文件的开头，所致使用read()等方法我们能看到读取的结果。

但是写入的方式打开文件如w，a：

w：打开文件后，光标是在文件的开头，但是以w方式打开文件会自动清空文件数据，所以我们在调用读取方法，我们依然看不到任何数据。
a：打开文件后，光标是在文件内容的末尾的，所以我们在调用读取方法，我们也依然会看不到任何数据。

（3）`seek()`

打开文件后，文件指针的位置会影响读取文件的数据。

seek()方法的作用：用来移动文件指针。

语法如下：

文件对象.seek(偏移量, 起始位置)

起始位置：

0：文件开头
1：当前位置
2：文件结尾

示例：

"""
语法： 文件对象.seek(偏移量, 起始位置)
0开头 1当前 2结尾
偏移量:要切换到的位置
"""
# 示例1:r打开文件
# 改变读取数据开始位置
f = open('test.txt', 'r+')

# 1.改变读取数据开始位置,开头偏移两位
f.seek(2, 0)

# 2.文件指针放到内容结尾
# f.seek(0, 2)  

# 读取文件
con = f.read()
print(con)
# 关闭文件
f.close()
"""
输出结果
cde
12345
abcde
abcde
"""

# 示例2:a打开文件
f = open('test.txt', 'a+')

# 文件指针放到文件开头
# 当参数为两个0的时候，可以简写成一个0
# 表示不偏移，起始位置是开头。
# f.seek(0, 0)
# f.seek(0)

# 读取文件
con = f.read()
print(con)
# 关闭文件
f.close()
"""
输出结果：
abcde
12345
abcde
abcde
"""

# 示例3.可以只写偏移量，
# 起始位置默认是0，开头
file_obj.seek(55)

# 从开头向后偏移80位
# file_obj.seek(80,0)
# 从当前位置向后偏移70位
# file_obj.seek(70,1)

# io.UnsupportedOperation: can't do nonzero end-relative seeks
# file_obj.seek(-10,2)

（4）`tell()`

# tell() 方法用来查看当前读取的位置(光标的位置)

示例

with open('demo2.txt','rt' , encoding='utf-8') as file_obj:
    # print(file_obj.read(100))
    # print(file_obj.read(30))

    # seek() 可以修改当前读取的位置
    # 中文一个字符代表三个字节，截取两个字节打印就会报错
    file_obj.seek(9)
    # seek()需要两个参数
    #   第一个 是要切换到的位置
    #   第二个 计算位置方式
    #       可选值：
    #           0 从头计算，默认值
    #           1 从当前位置计算
    #           2 从最后位置开始计算

    print(file_obj.read())

    # tell() 方法用来查看当前读取的位置
    print('当前读取到了 -->',file_obj.tell())

6、关闭

文件对象.close()

而我们在工作中对文件的标准处理格式为使用with...as...

# with ... as 语句用法
"""
#with open(file_name) as file_obj 和 file_obj = open(file_name) 是一样的
#open(file_name)的返回值赋值给了file_obj
with open(file_name) as file_obj :
    # 在with语句中可以直接使用file_obj来做文件操作
    # 此时这个文件只能在with中使用，一旦with结束则文件会自动close()
    print(file_obj.read())
"""

标准写法

# 确定文件名
file_name = 'hello'

try:
    # 打开文件
    with open(file_name) as file_obj :
        # 对文件进行处理
        print(file_obj.read())
except FileNotFoundError:
    # 文件不存在进行异常处理
    print(f'{file_name} 文件不存在~~')

7、综合练习:读取大文件

需求：读取大文件

# 确定文件名
file_name = 'demo.txt'

try:
    # 调用open()方法来打开一个文件，可以将文件分成两种类型
    # 一种，是纯文本文件（使用utf-8等编码编写的文本文件）
    # 一种，是二进制文件（图片、mp3、ppt等这些文件）
    # open()方法打开文件时，默认是以文本文件的形式打开的，
    # 但是open()方法默认的编码为None，
    # 所以处理文本文件时，必须要指定文件的编码。
    with open(file_name,encoding='utf-8') as file_obj:
        # 通过 read() 来读取文件中的内容
        # 如果直接调用read()它会将文本文件的所有内容全部都读取出来，
        # 如果要读取的文件较大的话，会一次性将文件的内容加载到内存中，
        # 容易导致内存泄漏（溢出）。
        # 所以对于较大的文件，不要直接调用read()方法读取文件。
        # 
        # read()可以接收一个size作为参数，
        # 该参数用来指定调用一次read()方法读取的字符的数量。
        # 默认值为-1，它会读取文件中的所有字符。
        # 可以为size指定一个值，这样read()方法会读取指定数量的字符，
        # 每一次读取都是从上次读取到位置开始读取的，
        # 如果字符的数量小于size，则会读取剩余所有的，
        # 如果已经读取到了文件的最后了，则会返回''空串，
        # content = file_obj.read(-1)
        content = file_obj.read(6)
       
    	"""
    	这里可以换成上边循环的方法，读取内容，
    	也可以换成其他的读取方法。
    	
    	# 定义一个变量，来指定每次读取的大小
        chunk = 100
        # 创建一个循环来读取文件内容
    	while True:
            # 读取chunk大小的内容
            content = file_obj.read(chunk)

            # 检查是否读取到了内容
            # content 空串为false
            if not content:
                # 内容读取完毕，退出循环
                break

            # 输出内容
            # print(content,end='')
    	"""
except FileNotFoundError :
    print(f'{file_name} 这个文件不存在！')