python文件读写

python文件读写

读写文件是最常见的操作之一,Python内置了读写文件的函数,整体是比较方便的。

在磁盘上读写文件的功能都是由操作系统提供的,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。

open方法

Python内置了open()函数,用于对文件进行读写操作。使用open()方法操作文件就像把大象塞进冰箱一样,可以分3步走,一是打开文件,二是操作文件,三是关闭文件。

open()方法的返回值是一个file对象,可以将它赋值给一个变量(文件句柄)。基本语法格式为:

  1. f = open(filename, mode)

PS:Python中,所有具有read和write方法的对象,都可以归类为file类型。而所有的file类型对象都可以使用open方法打开,close方法结束和被with上下文管理器管理。这是Python的设计哲学之一。

filename:一个包含了你要访问的文件名称的字符串值,通常是一个文件路径。

mode:打开文件的模式,有很多种,默认是只读方式r。

一个简单的例子:

  1. # 打开一个文件
  2. f = open("/tmp/foo.txt", "w")
  3. f.write("Python 是一种非常好的语言。\
  4. 我喜欢Python!!\
  5. ")
  6. # 关闭打开的文件
  7. f.close()

(1)打开模式:

模式操作说明
r只读默认模式,如果文件不存在就报错,存在就正常读取。
w只写如果文件不存在,新建文件然后写入;如果存在,先清空文件内容,再写入。
a追加如果文件不存在,新建文件,然后写入;如果存在,在文件的最后追加写入。
x新建如果文件存在则报错,如果不存在就新建文件,然后写入内容,比w模式更安全。
b二进制模式比如rb、wb、ab,以bytes类型操作数据
+读写模式比如r+、w+、a+

b模式

二进制模式,通常用来读取图片、视频等二进制文件。注意,它在读写的时候是以bytes类型读写的,因此获得的是一个bytes对象而不是字符串。在这个读写过程中,需要自己指定编码格式。在使用带b的模式时一定要注意传入的数据类型,确保为bytes类型。

可以在在线python3环境中运行代码学习

 
  1. s = 'ShowMeAI是数据科学与人工智能领域的资料库和学习社区'
  2. b = bytes(s,encoding='utf-8')
  3. f = open('test.txt','w')
  4. f.write(s)
  5. #这样没问题,正常写入了文件。
  6. #-------------------------------------------------
  7. s = "ShowMeAI是数据科学与人工智能领域的资料库和学习社区。\
  8. 我喜欢ShowMeAI!!\
  9. "
  10. b = bytes(s,encoding='utf-8')
  11. f = open('test_b.txt','wb') #注意多了个b
  12. f.write(s)
  13. #报错
  14. TypeError: a bytes-like object is required, not 'str'
  15. #意思是它需要一个bytes类型数据,你却给了个字符串
  16. #---------------------------------------------------
  17. s = "ShowMeAI是数据科学与人工智能领域的资料库和学习社区。\
  18. 我喜欢ShowMeAI!!\
  19. "
  20. b = bytes(s,encoding='utf-8')
  21. f = open('test_b.txt','wb') # 注意多了个b
  22. f.write(b) # 将变量b传给它,b是个bytes类型

+模式

对于w+模式,在读写之前都会清空文件的内容,建议不要使用!

对于a+模式,永远只能在文件的末尾写入,有局限性,建议不要使用!

对于r+模式,也就是读写模式,配合seek()和tell()方法,可以实现更多操作。

文件编码

要读取非UTF-8编码的文件,需要给open()函数传入encoding参数,例如,读取GBK编码的文件:

  1. >>> f = open('gbk.txt', 'r', encoding='gbk')
  2. >>> f.read()
  3. 'GBK'

遇到有些编码不规范的文件,可能会抛出UnicodeDecodeError异常,这表示在文件中可能夹杂了一些非法编码的字符。遇到这种情况,可以提供errors参数,表示如果遇到编码错误后如何处理。

  1. >>> f = open('gbk.txt', 'r', encoding='gbk', errors='ignore')

文件对象操作

每当我们用open方法打开一个文件时,将返回一个文件对象。这个对象内置了很多操作方法。下面假设,已经打开了一个f文件对象。

read函数

读取一定大小的数据, 然后作为字符串或字节对象返回。size是一个可选的数字类型的参数,用于指定读取的数据量。当size被忽略了或者为负值,那么该文件的所有内容都将被读取并且返回。

  1. f = open("test.txt", "r")
  2. str = f.read()
  3. print(str)
  4. f.close()

如果文件体积较大,请不要使用read()方法一次性读入内存,而是read(512)这种一点一点的读。

readline函数

从文件中读取一行n内容。换行符为’\
‘。如果返回一个空字符串,说明已经已经读取到最后一行。这种方法,通常是读一行,处理一行,并且不能回头,只能前进,读过的行不能再读了。

  1. f = open("test.txt", "r")
  2. str = f.readline()
  3. print(str)
  4. f.close()

readlines函数

将文件中所有的行,一行一行全部读入一个列表内,按顺序一个一个作为列表的元素,并返回这个列表。readlines方法会一次性将文件全部读入内存,所以也存在一定的风险。但是它有个好处,每行都保存在列表里,可以随意存取。

  1. f = open("test.txt", "r")
  2. a = f.readlines()
  3. print(a)
  4. f.close()
  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值