【python】文件操作

Yui_

已于 2024-10-25 19:43:17 修改

阅读量1.3k

点赞数 59

分类专栏： python 文章标签： python java 前端学习笔记开发语言服务器

于 2024-10-09 14:29:45 首次发布

本文链接：https://blog.csdn.net/2303_79015671/article/details/142786073

版权

python 专栏收录该内容

8 篇文章 5 订阅

订阅专栏

文章目录

1.函数
2.列表与元组
3.字典
4.文件

1.函数

函数

2.列表与元组

列表与元组

3.字典

字典

4.文件

4.1 文件是什么

变量是把数据保存到内存中，如果程序重启/断电，内存中的数据就会丢失。
要想实现数据的持久化存储，就需要把数据存储，就可以把数据存储到硬盘中，也就是在文件中存储。
一些常见的文件类型：

文本文件 txt
可执行文件 exe class 
图片文件 jpg png
视频文件 mp4 mov
office文件 ppt docx

本文主要聚焦于文本文件。

4.2 文件路径

在系统中会存在特别多的文件，为了人让这些文件更加全面的被组织，往往会使用很多的文件夹，在Linux也叫目录。
实际上一个文件往往会进行许多的目录嵌套。为了方便确定一个文件的位置，使用文件路径来描述就很方便了。
以我存储python代码的路径为例D:\code\python

D:表示盘符，不区分大小写。
每个\表示一级目录，当前的python就是放在D盘下的code目录下的。
目录之间的分隔符，可以使用\也可以使用/一般在编写代码时使用/更方便。
绝对路径于相对路径：
以盘符开头的路径，我们称为绝对路径。
相对路径需要先指定一个基准目录，然后以基准目录位参照点，间接的找到目标文件。
在描述一个文件路径时，使用绝对路径还是相对路径都是可以的。

4.3 文件操作

要使用文件，主要通过文件来保存数据，并且在后续把保存数据调出来。为了读写文件，首先当然需要打开文件，在完成操作后在关闭文件。

4.3.1 打开文件

使用内建函数open打开文件。

f = open('d:/test.txt','r')

第一个参数是一个字符串，表示要打开的路径。
第二个参数是一个字符串，表示打开方法，其中r表示按读方式打开，w表示按照写方式打开，’a‘表示追加方式打开。
如果文件打开成功，返回一个文件对象，后续的读写文件操作都是围绕这个文件对象展开的。
如果打开文件失败，如指定路径不存在，就会抛出异常。

4.3.2 关闭文件

使用close方法关闭已打开的的文件。

f.close()

使用完毕的文件一定要记得关闭。
一个程序能同时打开的文件数是有限制的

flist = []
count = 0
while True:
	f = open('d:/tmp/test.txt','r')
	flist.append(f)
	count+=1
	print(f'count = {count}')
'''
...
count = 8187
count = 8188
count = 8189
Traceback (most recent call last):
  File "d:\code\python\python_test1\test.py", line 158, in <module>
OSError: [Errno 24] Too many open files: 'd:/tmp/test.txt'
'''

从代码上来看，大概一个程序是可以打开8000个文件。如果一种循环的打开文件，而不去关闭，就会出现上述问题。当一个程序打开的文件超过上限，就会抛出异常。

上述代码中，使用一个列表来保存所有文件对象，如果不进行保存，那么python内置的垃圾回收机制就会在文件销毁的时候自动关闭文件。
但是由于垃圾回收机制不一定及时，所以我们写代码时仍然需要手动回收，避免依赖于自动回收。

4.3.3 写文件

文件打开后，就可以写文件了。

写文件，要使用学方法打开，open第二个参数为w。
使用write方法写入文件。

f = open('d:/tmp/test.txt','w')
f.write('i am yui')
f.close()

打开test.txt发现已经写入。
如果在r方式下写入的话，程序会抛出异常。

使用w打开文件成功后，原有文件中的数据会清零。
使用a实现追加写，此时原有内容不变，写入的内容会存在于之前文件内容的末尾。

f = open('d:/tmp/test.txt','w')
f.write('i am yui')
f.close()

f = open('d:/tmp/test.txt','a')
f.write(',hello')
f.close()

针对已经关闭的文件对象进行写入，程序会抛出异常。

4.3.4 读文件

读文件内容需要使用r方式打开文件。
使用read方法完成读操作，参数表示读取几个字符。

f = open('d:/tmp/test.txt','r')
result = f.read(10)
print(result)
f.close()
'''
i am yui,h
'''

如果文件是多行文本，可以使用for循环一次读取一行。
我们先构造一个多行的文本文件。

下面来打印这文件的内容。

f = open('d:/tmp/test.txt','r')
for line in f:
	print(f'line = {line}')
f.close()
'''
line = 111111

line = 222222

line = 333333

line = 444444

'''

由于文件里每行的末尾都自带一个换行符，print打印的时候又会默认加上一个换行符，因此打印结果看起来之间存在空格。
使用

print(f'line = {line}',end='')

可以取代print自带的换行符。

使用readline直接把文件整个内容读取出来，返回一个列表，每个元素即为一行。

f = open('d:/tmp/test.txt','r')
lines = f.readlines()
print(lines)
f.close()
'''
['111111\n', '222222\n', '333333\n', '444444\n']
'''

4.4 关于中文的处理

当文件内容出现中文时，读取文件内容可能会出现错误。即出现乱码。
为什么会出现这种情况呢？
计算机表示中文的时候，会采取一定的编码方式，被称为字符集

所谓的“编码方式”，本质就是使用数字表示汉字。
众所周知，计算机只能表示二进制数据，要想表示英文字母或者汉字或者其他的文字字符，就就要通过编码。
最简单的字符编码ASCII，使用一个简单的整数就可以表示英文字母和数字，但是如果要表示汉字就需要更大的码表了。
目前常用的汉字编码方式主要是：GBK和UTF-8.

为此必须保证文件本身的编码方式，和python代码中读取文件使用的编码方式相一致，才能够避免出错。

python3默认打开文件的字符集跟随系统，而Windows简体中文版的字符集采用GBK，所以如果文件本身是GBK的编码，直接就能正确处理。如果不是的就会出错。

4.5 使用上下文管理器

打开文件后，最容易忘记的就是关闭。python提供了上下文管理器，来帮助我们自动关闭文件。

使用with语句打开文件。
当with内部的代码执行完毕后，就会自动调用关闭方法。

with open('d:/tmp/test.txt','r') as f:
	lines = f.readlines()
	print(lines)
'''
['111111\n', '222222\n', '333333\n', '444444\n']
'''