【无为则无心&Python基础】— 52、Python中文件的读写操作

本文详细介绍了Python中文件操作的步骤,包括打开、读写和关闭文件。重点讲解了文件的打开模式,如读、写、追加,以及二进制模式。此外,还讨论了文件对象的方法,如写入、读取和文件指针的移动。最后,提到了在处理大文件时的注意事项。
摘要由CSDN通过智能技术生成

一、文件操作步骤

当我们要读取或者写入文件时,我们需要打开文件,在操作完毕时,我们需要关闭文件,以便释放和文件操作相关的系统资源。因此,文件操作的主要包括以下:

  1. 打开文件
  2. 读写等操作
  3. 关闭文件

注意:可以只打开和关闭文件,不进行任何读写操作。

二、文件的读写操作

1、文件的打开

在Python中,使用open( )函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下:

# 文档中语法如下
open(file, mode='r', buffering=-1, encoding_=None, errors=None, newline=None, closefd=True, opener=None)

# 我们可以看到这个open( )函数有很多的参数
# 但是我们也可以看到处了第一个参数,其他的都是关键字参数
# 也就是说,除了第一个必填,其他的都可以不填写。
# 但是我们在实际开发中,比较常用的就是前两个选项。

open(name, mode)
  • name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。
  • mode:设置打开文件的模式(访问模式):只读、写入、追加等。

2、打开文件模式

在Python中,文件的打开模式如下表:

模式描述
r以只读方式打开文件。文件的指针将会放在文件的开头(相当于光标所在的位置)。这是默认模式。
rb以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+打开一个文件用于读写。文件指针将会放在文件的开头。
rb+以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。(文件指针在开头,覆盖文件)
wb以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
w+打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb+以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
a打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。(文件指针在内容的结尾处,方便追加内容)
ab以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

说明:

  • 主要的三种打开模式为rwa

    • 凡事带+都是可读可写模式。
    • 凡事带b的都是以二进制格式打开文件。
    • 所有的访问模式的基础特点都要遵循三种猪访问模式rwa
  • x模式

    x模式用来新建文件,如果文件不存在则创建,存在则报错。

    如果想创建一个文件,不想覆盖已有的文件,就可以选择这个操作文件的方式。

  • bt

    • t是以纯文本方式打开文件,默认就是t
    • b是以二进制方式打开文件。

关于打开文件模式的官方文档,在[The Python Standard Library] —> [Built-in Functions] —> 内置方法列表中选择[open()]。

如下图:
在这里插入图片描述

3、获取一个文件对象

也就是打开一个文件。

# open()函数返回一个对象,这个对象就代表了当前打开的文件。
# file_obj是一个文件对象,文件打开状态
file_name= 'test.txt'
file_obj = open(file_name, 'r')

# <class '_io.TextIOWrapper'>
print(type(file_obj)) 
# <_io.TextIOWrapper name='test.txt' mode='r' encoding='cp936'>
print(file_obj)  

注意:此时的file_objopen( )函数返回的文件对象。

只要没有报错,就证明文件打开了。

当我们获取了文件对象以后,所有的对文件的操作都应该通过对象来进行。

4、关于文件路径

  • 如果目标文件和当前文件在同一级目录下,则直接使用文件名即可。

  • 可以使用..来返回一级目录,也就是上一级目录。

  • 在windows系统使用路径时,可以使用/来代替\,在Python中会自动转换,

    或者可以使用 \\ 来代替 \

    或者也可以使用原始字符串,如file_name = r'hello\demo.txt'

    也就是在字符串前面加上一个小写的r,是字符串原样输出,不加任何转义。

  • 如果目标文件距离当前文件比较远,此时可以使用绝对路径。

    绝对路径应该从磁盘的根目录开始书写,如file_name = r'C:\Users\123\Desktop\hello.txt'

5、文件对象方法

(1)写方法
语法
对象对象.write('内容')
示例
# 1. 打开文件
f = open('test.txt', 'w')

# 2.文件写入
f.write('hello world')

# 3. 关闭文件
# 只要控制台显示Process finished with exit code 0
# 证明进程已经结束,代码执行完成。
f.close()

注意:

  1. wa模式:如果文件不存在则创建该文件;如果文件存在,w模式先清空再写入,a模式直接末尾追加。
  2. r模式:如果文件不存在则报错。
练习说明
"""
测试目标
1. 访问模式对文件的影响
2. 访问模式对write()的影响
3. 访问模式是否可以省略
"""

# 访问模式参数可以省略, 如果省略表示访问模式为r(只读)

"""
1.r-只读模式打开文件: 
1.1如果文件不存在,报错。
1.2不支持写入操作,表示只读。
"""
# 如果文件不存在,报错
# 结果:FileNotFoundError: [Errno 2] No such file or directory: 'test.txt'
f = open('test.txt', 'w')

# 文件存在,但不支持写入操作,表示只读。
f = open('test.txt', 'r')
# io.UnsupportedOperation: not writable
f.write('aa')  
f.close()


"""
2.w-写入模式打开文件:
2.1如果文件不存在,新建文件
2.2执行写入,会覆盖原有内容
"""
# 文件存在则直接打开文件,文件不存在则创建该文件
f = open('1.txt', 'w')
# 写入内容直接覆盖原文件内容。
f.write('bbb')
f.close()


"""
3.a-添加模式打开文件:
3.1如果文件不存在,新建文件
3.2在文件原有内容基础上,追加新内容
"""
# 文件存在则直接打开文件,文件不存在则创建该文件
f = open('2.txt', 'a')
# 在文件原有内容基础上,追加新内容
f.write('xyz')
f.close()


"""
4.运行一次程序,write()方法会可以分多次向文件中写入内容
一次运行中,重复的调用write()向文件中写入内容,
不会进行覆盖。
单独调用两次,第二次的内容会覆盖第一次的内容。

`with...as...`写法看 <6、关闭>中有讲解
"""
file_name = 'demo.txt'

with open(file_name, 'w', encoding='utf-8') as file_obj:
    file_obj.write('aaa\n')
    file_obj.write('bbb\n')
    file_obj.write('ccc\n')
"""
文件内容:
aaa
bbb
ccc
"""


"""
5.write('内容')方法中的内容,只能是字符串,
如果向输入一个数值型,需要进行类型转换,否则会报错:
TypeError: write() argument must be str, not int
"""
# 代码片段如下:
file_obj.write(str(123))

"""
6.write()方法有返回值,
会返回写入的字符的个数
"""
# 代码片段如下:
r = file_obj.write('今天天气真不错')
print(r)  # 7
(2)读方法
read( )

read( )方法,用来读取文件中的内容,它会将内容全部保存为一个字符串返回。

文件对象.read(num)

num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。

示例:

"""
文件内容如果有换行,底层是\n换行,会占用1个字节,
导致read()方法填写的参数与读取出来的数据不匹配.
"""
f = open('test.txt', 'r')

# read不写参数表示读取所有;
# print(f.read())
print(f.read(10))

f.close()

readlines( )

readlines( )方法可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据(包括换行符)为一个元素。

f = open('test.txt')
content = f.readlines()

# ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc']
print(content)

# 关闭文件
f.close()
readline( )

readline( )方法一次读取一行内容。

f = open('test.txt')  # 只读方式打开

# 第一次调用`readline( )`方法方法,即读取文件第一行内容
content = f.readline()
print(f'第一行:{content}')

# 第二次调用`readline( )`方法方法,即读取文件第二行内容
# 以此类推
content = f.readline()
print(f'第二行:{content}')

# 关闭文件
f.close()

"""
输出结果:
第一行:abcde

第二行:12345
"""

for循环方式读取文件内容
# 定义文件名
file_name = 'demo.txt'

# 循环读取文件内容,变量t就文件内的一行内容
# 遍历一次,读取一行。
with open(file_name, encoding='utf-8') as file_obj:
    for t in file_obj:
        print(t)

注意:

我们上边的练习都是以只读的方法打开文件,然后在读取数据。以只读的方式打开文件,光标默认是在文件的开头,所致使用read()等方法我们能看到读取的结果。

但是写入的方式打开文件如wa

  • w:打开文件后,光标是在文件的开头,但是以w方式打开文件会自动清空文件数据,所以我们在调用读取方法,我们依然看不到任何数据。

  • a:打开文件后,光标是在文件内容的末尾的,所以我们在调用读取方法,我们也依然会看不到任何数据。

(3)seek()

打开文件后,文件指针的位置会影响读取文件的数据。

seek()方法的作用:用来移动文件指针。

语法如下:

文件对象.seek(偏移量, 起始位置)

起始位置:

  • 0:文件开头
  • 1:当前位置
  • 2:文件结尾

示例:

"""
语法: 文件对象.seek(偏移量, 起始位置)
0开头 1当前 2结尾
偏移量:要切换到的位置
"""
# 示例1:r打开文件
# 改变读取数据开始位置
f = open('test.txt', 'r+')

# 1.改变读取数据开始位置,开头偏移两位
f.seek(2, 0)

# 2.文件指针放到内容结尾
# f.seek(0, 2)  

# 读取文件
con = f.read()
print(con)
# 关闭文件
f.close()
"""
输出结果
cde
12345
abcde
abcde
"""

# 示例2:a打开文件
f = open('test.txt', 'a+')

# 文件指针放到文件开头
# 当参数为两个0的时候,可以简写成一个0
# 表示不偏移,起始位置是开头。
# f.seek(0, 0)
# f.seek(0)

# 读取文件
con = f.read()
print(con)
# 关闭文件
f.close()
"""
输出结果:
abcde
12345
abcde
abcde
"""

# 示例3.可以只写偏移量,
# 起始位置默认是0,开头
file_obj.seek(55)

# 从开头向后偏移80位
# file_obj.seek(80,0)
# 从当前位置向后偏移70位
# file_obj.seek(70,1)

# io.UnsupportedOperation: can't do nonzero end-relative seeks
# file_obj.seek(-10,2)
(4)tell()
# tell() 方法用来查看当前读取的位置(光标的位置)

示例

with open('demo2.txt','rt' , encoding='utf-8') as file_obj:
    # print(file_obj.read(100))
    # print(file_obj.read(30))

    # seek() 可以修改当前读取的位置
    # 中文一个字符代表三个字节,截取两个字节打印就会报错
    file_obj.seek(9)
    # seek()需要两个参数
    #   第一个 是要切换到的位置
    #   第二个 计算位置方式
    #       可选值:
    #           0 从头计算,默认值
    #           1 从当前位置计算
    #           2 从最后位置开始计算

    print(file_obj.read())

    # tell() 方法用来查看当前读取的位置
    print('当前读取到了 -->',file_obj.tell())

6、关闭

文件对象.close()

而我们在工作中对文件的标准处理格式为使用with...as...

# with ... as 语句用法
"""
#with open(file_name) as file_obj 和 file_obj = open(file_name) 是一样的
#open(file_name)的返回值赋值给了file_obj
with open(file_name) as file_obj :
    # 在with语句中可以直接使用file_obj来做文件操作
    # 此时这个文件只能在with中使用,一旦with结束则文件会自动close()
    print(file_obj.read())
"""

标准写法

# 确定文件名
file_name = 'hello'

try:
    # 打开文件
    with open(file_name) as file_obj :
        # 对文件进行处理
        print(file_obj.read())
except FileNotFoundError:
    # 文件不存在进行异常处理
    print(f'{file_name} 文件不存在~~')

7、综合练习:读取大文件

需求:读取大文件

# 确定文件名
file_name = 'demo.txt'

try:
    # 调用open()方法来打开一个文件,可以将文件分成两种类型
    # 一种,是纯文本文件(使用utf-8等编码编写的文本文件)
    # 一种,是二进制文件(图片、mp3、ppt等这些文件)
    # open()方法打开文件时,默认是以文本文件的形式打开的,
    # 但是open()方法默认的编码为None,
    # 所以处理文本文件时,必须要指定文件的编码。
    with open(file_name,encoding='utf-8') as file_obj:
        # 通过 read() 来读取文件中的内容
        # 如果直接调用read()它会将文本文件的所有内容全部都读取出来,
        # 如果要读取的文件较大的话,会一次性将文件的内容加载到内存中,
        # 容易导致内存泄漏(溢出)。
        # 所以对于较大的文件,不要直接调用read()方法读取文件。
        # 
        # read()可以接收一个size作为参数,
        # 该参数用来指定调用一次read()方法读取的字符的数量。
        # 默认值为-1,它会读取文件中的所有字符。
        # 可以为size指定一个值,这样read()方法会读取指定数量的字符,
        # 每一次读取都是从上次读取到位置开始读取的,
        # 如果字符的数量小于size,则会读取剩余所有的,
        # 如果已经读取到了文件的最后了,则会返回''空串,
        # content = file_obj.read(-1)
        content = file_obj.read(6)
       
    	"""
    	这里可以换成上边循环的方法,读取内容,
    	也可以换成其他的读取方法。
    	
    	# 定义一个变量,来指定每次读取的大小
        chunk = 100
        # 创建一个循环来读取文件内容
    	while True:
            # 读取chunk大小的内容
            content = file_obj.read(chunk)

            # 检查是否读取到了内容
            # content 空串为false
            if not content:
                # 内容读取完毕,退出循环
                break

            # 输出内容
            # print(content,end='')
    	"""
except FileNotFoundError :
    print(f'{file_name} 这个文件不存在!')
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值