【Python任务导向】文件读写（with语法、os模块、缓存区概念、偏移量概念）

最新推荐文章于 2024-09-02 23:19:37 发布

白拾

最新推荐文章于 2024-09-02 23:19:37 发布

阅读量824

点赞数 6

分类专栏： # Python笔记文章标签： python 缓存开发语言

本文链接：https://blog.csdn.net/Discover304/article/details/122438730

版权

Python笔记专栏收录该内容

16 篇文章 4 订阅

订阅专栏

【Python】高级笔记第一部分：文件读写和正则表达式
全系列导航见：Python教程整理

🍀碎碎念🍀
Hello米娜桑，这里是英国留学中的杨丝儿。我的博客的关键词集中在算法、机器人、人工智能、数学等等，点个关注吧，持续高质量输出中。
🌸唠嗑QQ群：兔叽的魔术工房 (942848525)
⭐️B站账号：杨丝儿今天也在科学修仙（UP主跨站求个关注）

🌟数据处理概述

数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。当下数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度，极大地影响了人类社会发展的进程。数据处理也是大数据，数据分析等后续科学的基本环节。

🌟基本概念

数据：能够输入到计算机中并被识别处理的信息集合。

数据存储的发展阶段：

人工管理阶段：人为管理，没有固定的格式和存储方法，容易混乱。
文件管理阶段：数据可以长期保存，存储数据量大，使用简单。
数据库管理阶段：高效，可以存储更大量数据，便于管理，更加专业。

🌟文件处理

⭐️概述

文件是保存在持久化存储设备(硬盘、U盘、光盘…)上的一段数据，一个文本，一个py文件，一张图片，视频音频等这些都是文件。主要有以下两种类别：

文本文件：打开后会自动解码为字符，如txt文件，word文件，py程序文件。
二进制文件：内部编码为二进制码，无法通过文字编码解析，如压缩包，音频，视频，图片等。

在python3中引入了 字节串 的概念，与str不同，字节串以字节序列值表达数据，更方便用来处理二进程数据。

字符串与字节串相互转化方法

普通的英文字符字符串常量可以在前面加b转换为字节串，例如：b'hello'
变量或者包含非英文字符的字符串转换为字节串方法：str.encode()
字节串转换为字符串方法 : bytes.decode()

注意：python字符串用来表达utf8字符，因为并不是所有二进制内容都可以转化为utf8字符，所以不是所有字节串都能转化为字符串，但是所有字符串都能转化成二进制，所以所有字符串都能转换为字节串。

⭐️文件读写操作

使用程序操作文件，无外乎对文件进行读或者写

读：即从文件中获取内容
写：即修改文件中的内容

对文件实现读写的基本操作步骤为：打开文件，读写文件，关闭文件。

✨打开文件

功能：打开一个文件，返回一个文件对象。
file_object = open(file_name, access_mode='r', buffering=-1，encoding=None)
参数：
file_name：文件名；
access_mode：打开文件的方式,如果不写默认为‘r’
buffering： 1表示有行缓冲，默认则表示使用系统默认提供的缓冲机制。
encoding：设置打开文件的编码方式，如 ‘UTF-8’。一般Linux下不需要，Windows需要。

返回值：成功返回文件操作对象。

注意：以二进制方式打开文件，读取内容为字节串，写入也需要写入字节串。
小贴士：无论什么文件都可以使用二进制方式打开，但是二进制文件则不能以文本方式打开，否则后续读写会报错。

打开模式	效果
r	以只读方式打开，文件必须存在
w	以只写方式打开，文件不存在则创建，存在清空原有内容
a	以 (只) 追加模式打开，文件不存在则创建，存在则继续进行写操作
r+	以读写模式打开，文件必须存在
w+	以读写模式打开文件，不存在则创建，存在清空原有内容
a+	追加并可读模式，文件不存在则创建，存在则继续进行写操作
rb	以二进制读模式打开同r
wb	以二进制写模式打开同w
ab	以二进制追加模式打开同a
rb+	以二进制读写模式打开同r+
wb+	以二进制读写模式打开同w+
ab+	以二进制读写模式打开同a+

文件打开代码示例：open_file.py

# 读方式打开文件
file = open("../day02/2.txt","r")

# 写方法打开
file = open("file.txt","w") # 清除原来内容
file = open("file.txt","a") # 不会清除原来内容
# 操作文件
···

# 关闭
file.close()

✨读取文件

方法1
功能：来直接读取文件中字符（字符包括换行符和缩进符）。
```
read([size])
```
- 参数：如果没有给定size参数（默认值为-1）或者size值为负，文件将被读取直至末尾，给定size最多读取给定数目个字符（字节）。
- 返回值：返回读取到的内容。读到文件结尾如果继续进行读操作会返回空字符串，可以根据这个信息判断读取结束。
注意：文件过大时候不建议直接读取到文件结尾，占用内存较多，效率较低。
方法2
功能：用来读取文件中一行。
```
readline([size])
```
- 参数：类似read函数。如果没有给定size参数（默认值为-1）或者size值为负，表示读取一行，给定size表示最多读取制定的字符（字节）。
- 返回值：返回读取到的内容
方法3
功能：读取文件中的每一行作为列表中的一项。
```
readlines([sizeint])
```
- 参数：如果没有给定size参数（默认值为-1）或者size值为负，文件将被读取直至末尾，给定size表示读取到size字符所在行为止。
- 返回值：返回读取到的内容列表
方法4
文件对象本身也是一个可迭代对象，在for循环中可以迭代文件的每一行。
```
for line in f:
     print(line)
```

✨写入文件

方法1
功能: 把文本数据或二进制数据块的字符串写入到文件中去
```
write(data)
```
- 参数：要写入的内容
- 返回值：写入的字符个数
注意：所有的格式都需要使用字符添加。例如：需要换行要在写入内容中添加\n。
方法2
功能：接受一个字符串列表作为参数，将它们写入文件。
```
writelines(str_list)
```
- 参数: 要写入的内容列表

✨关闭文件

打开一个文件后我们就可以通过文件对象对文件进行操作了，当操作结束后可以关闭文件操作

file_object.close()

可以销毁对象节省资源，（当然如果不关闭程序结束后对象也会被销毁）。
防止后面对这个对象的误操作。

✨with操作

python中的with语句也可以用于访问文件，在语句块结束后会自动释放资源。

with context_expression [as obj]:
    with-body

with访问文件。语句块结束后会自动释放f所以不再需要close().

with open('file','r+') as f:
    f.read()

✨读写缓冲区

定义
系统自动的在内存中为每一个正在使用的文件开辟一个空间，在对文件读写时都是先将文件内容加载到缓冲区，再进行读写。
作用
1. 减少和磁盘的交互次数，保护磁盘。
2. 提高了对文件的读写效率。（次次从硬盘读写，速度太慢了）
缓冲区设置

类型设置方法注意事项
系统自定义 buffering=-1
行缓冲 buffering=1 当遇到\n时会刷新缓冲
指定缓冲区大小 buffering=[>1] 必须以二进制方式打开
刷新缓冲区条件
1. 缓冲区被写满
2. 程序执行结束或者文件对象被关闭
3. 程序中调用flush()函数，主动刷新缓冲区。
```
file_obj.flush()
```

类型	设置方法	注意事项
系统自定义	buffering=-1
行缓冲	buffering=1	当遇到\n时会刷新缓冲
指定缓冲区大小	buffering=[>1]	必须以二进制方式打开

✨文件偏移量

定义

打开一个文件进行操作时系统会自动生成一个记录，记录每次读写操作时所处的文件位置，每次文件的读写操作都是从这个位置开始进行的。

注意：
1. r或者w方式打开，文件偏移量在文件开始位置
2. a方式打开，文件偏移量在文件结尾位置
文件偏移量控制
功能：获取文件偏移量大小
```
tell()  
```
- 返回值：文件偏移量
功能: 移动文件偏移量位置
```
seek(offset [,whence])
```
- 参数1：offset 代表相对于基准位置移动的字节数。负数表示向前移动，正数表示向后移动。
- 参数2：whence 设置基准位置为0/1/2。默认值为 0，代表从文件开头算起。1代表从当前位置算起，2 代表从文件末尾算起。
  注意：必须以二进制方式打开文件时，基准位置才能是1或者2

⭐️os模块

os模块是Python标准库模块，包含了大量的文件处理函数。

获取文件大小

os.path.getsize(file)
功能： 获取文件大小
参数： 指定文件
返回值： 文件大小

查看文件列表

os.listdir(dir)
功能： 查看文件列表
参数： 指定目录
返回值：目录中的文件名列表

判断文件是否存在

os.path.exists(file)
功能： 判断文件是否存在
参数： 指定文件
返回值： 布尔值

删除文件

os.remove(file)
功能： 删除文件 
参数： 指定文件

白拾

关注

6
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录