(小甲鱼python)文件永久存储(下)总结 文件处理with语句和上下文管理器、pickle模块详解

一、基础复习

上节课回顾:
1.文件永久存储(上) python文件永久存储(创建打开文件、文件对象的各种方法及含义)
2.文件永久存储(中)总结 路径处理 pathlib–面向对象的文件系统路径 绝对路径vs相对路径(路径查询、路径修改、查找功能)

二、文件操作

1.with语句和上下文管理器
传统的文件操作
文件操作三板斧:打开文件、操作文件、关闭文件
例1:

>>> f=open("FishC,txt","w")
>>> f.write("I love Fishc.")     
13           #写入字符串的长度
>>> f.close()

使用with语句操作
例2:
代码功能和例1相同,不需要手动关闭文件

>>> with open("Fishc,txt","w") as f:
	f.write("I love Fishc.")

	
13
>>> 

不在IDLE中执行,在test.py文件中执行
例3:

 f=open("FishC,txt","w")
 f.write("I love Fishc.")
1/0
 f.close()

运行结果报错,除法运算中,除数不能为0。但创建了一个FishC,txt的文件,文件中没有内容,因为程序出错的时候,并没有机会执行到这个文件关闭的一个操作,所以写入的内容在缓冲区中,并没有写入,程序就关闭了。
在这里插入图片描述
改成with的形式,

with open("FishC,txt","w") as f:
    f.write("I love Fishc.")
    1/0

可以看到结果依然会报错,但FishC,txt里面有内容,with上下文管理器可以帮你确保文件的正常关闭。在这里插入图片描述
2.pickle模块
允许将字符串、列表、字典这些python对象保存为文件的形式。
python对象序列化,将Python对象转化为二进制字节流的过程。

2.1第一个函数dump函数
例4:

import pickle

x,y,z = 1,2,3
s="Fishc"
l=["小甲鱼",520,3.14]
d={"one":1,"two":2}

with open("data.pkl","wb") as f:   #保存为pickle文件,后缀名为pkl,以二进制形式打开
    pickle.dump(x,f)
    pickle.dump(y,f)
    pickle.dump(z,f)
    pickle.dump(s,f)
    pickle.dump(l,f)
    pickle.dump(d,f)

出现了一个data.pkl文件在这里插入图片描述
打开后为二进制形式。文本文件打开为乱码。![在这里插入图片描述](https://img-blog.csdnimg.cn/17e5be9d487b4c898ed4f23da4af1ec2.png:

2.2第二个函数load()
编写一个read.py文件,将乱码读出来
例5:

import pickle
with open("data.pkl","rb") as f:          #读取wb改为rb
   x=pickle.load(f)
   y=pickle.load(f)
   z=pickle.load(f)
   s=pickle.load(f)
   l=pickle.load(f)
   d=pickle.load(f)

print(x,y,z,s,l,d,sep="\n")

结果:
在这里插入图片描述对内容用元祖进行打包
例6:

import pickle

x,y,z = 1,2,3
s="Fishc"
l=["小甲鱼",520,3.14]
d={"one":1,"two":2}

with open("data.pkl","wb") as f:
    pickle.dump((x,y,z,s,l,d),f)

读取出来,进行解包得到的内容是一样的。

import pickle
with open("data.pkl","rb") as f:
    x,y,z,s,l,d=pickle.load(f)
    
print(x,y,z,s,l,d,sep="\n")

在这里插入图片描述

课后题:
1.with 上下文管理器最核心的功能是什么?
答:确保资源的释放。
2.请问下面代码段 A 和代码段 B 的执行结果是否等价?
代码段 A:

f = open("FishC.txt", "w")
f.write("I love FishC.")
1 / 0
f.close()

代码段 B:

with open("FishC.txt", "w") as f:
    f.write("I love FishC.")
    1 / 0

答:不等价。
解析:with 上下文管理器可以确保文件被正确关闭(尽管中间出现了异常)
3.下面是使用 pickle 保存 Python 对象的代码,请问哪里做错了?

import pickle
    
x = 250
y = 3.14
z = "FishC"
    
with open("data.pkl", "w") as f:
    pickle.dump((x, y, z), f)

答:由于 pickle 是将 Python 对象序列化保存,是二进制形式,因此需要使用 “wb” 的文件打开模式。
解析:读取也一样噢,人家是二进制文件,而非文本文件~
4. 如果想要读取一个 pickle 文件,是否需要预先知道其中的对象类型和数量?
答:不需要。
解析:load() 函数会根据 dump() 函数保存的顺序,将对象逐个读取出来。
5.请问可以使用 with 语句管理两个文件的上下文吗?
答:可以。
比如原来是这样的代码:

f1 = open("FishC.txt", "r")
f2 = open("FishD.txt", "w")
    
f1.seek(10)
f2.write(f1.read(5))
    
f1.close()
f2.close()

使用 with 语句写法如下:

with open("FishC.txt", "r") as f1, open("FishD.txt", "r") as f2:
    f1.seek(10)
    f2.write(f1.read(5))

题目来自小甲鱼python文件永久存储(下)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pythonpickle模块是用来实现序列化的,即将Python的对象转换成字节流,方便存储和传输。pickle模块支持多种协议,其协议0是最早的版本,协议1和协议2是Pyhton2引入的,协议3是Python3.0引入的,协议4是Python3.4引入的,每个协议都有其特点和适用范围。 下面我们来详细了解一下pickle模块的使用方法和各个协议的特点。 ## 基本用法 pickle模块提供了dumps、dump、loads和load四个函数,分别用来进行序列化和反序列化操作。其dumps和loads函数可以直接将对象转换成字节流或将字节流转换成对象,而dump和load函数则可以将对象序列化到文件或从文件反序列化对象。 ### 序列化 将Python对象转换成字节流的过程称为序列化,可以使用dumps函数实现: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} bytes_data = pickle.dumps(data) print(bytes_data) ``` 输出结果为: ``` b'\x80\x04\x95\x17\x00\x00\x00\x00\x00\x00\x00}\x94(\x8c\x04name\x94\x8c\x03Tom\x94\x8c\x03age\x94K\x12\x8c\x06gender\x94\x8c\x04male\x94u.' ``` 可以看到,data字典被转换成了一串二进制的字节流。 ### 反序列化 将字节流转换成Python对象的过程称为反序列化,可以使用loads函数实现: ```python import pickle bytes_data = b'\x80\x04\x95\x17\x00\x00\x00\x00\x00\x00\x00}\x94(\x8c\x04name\x94\x8c\x03Tom\x94\x8c\x03age\x94K\x12\x8c\x06gender\x94\x8c\x04male\x94u.' data = pickle.loads(bytes_data) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ### 文件操作 除了使用dumps和loads函数进行序列化和反序列化操作外,pickle模块还提供了dump和load函数用于将对象序列化到文件或从文件反序列化对象。 将对象序列化到文件: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wb') as f: pickle.dump(data, f) ``` 从文件反序列化对象: ```python import pickle with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` ## 协议0 协议0是最早的版本,它使用ASCII码来表示序列化后的对象,因此序列化后的数据比较大。使用协议0时,可以指定文件打开模式为't',表示以文本模式打开文件: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wt') as f: pickle.dump(data, f, protocol=0) with open('data.pkl', 'rt') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'age': 18, 'gender': 'male', 'name': 'Tom'} ``` ## 协议1 协议1和协议2是Python2引入的,它们使用更紧凑的二进制格式表示序列化后的对象。协议1可以指定文件打开模式为'wb',表示以二进制模式打开文件: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wb') as f: pickle.dump(data, f, protocol=1) with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ## 协议2 协议2是协议1的改进版本,它支持新的对象类型,如集合、字典等。在Python2,协议2是默认使用的协议,如果不指定协议号,则使用协议2。 在Python3pickle模块默认使用协议3,但仍然可以使用协议2: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wb') as f: pickle.dump(data, f, protocol=2) with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ## 协议3 协议3是Python3.0引入的,它支持更多的对象类型,如bytes、bytearray、set等。在Python3,协议3是默认使用的协议,因此可以省略protocol参数: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wb') as f: pickle.dump(data, f) with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ## 协议4 协议4是Python3.4引入的,它支持更多的对象类型,如memoryview、tuple等。协议4还支持从流读取指定长度的数据,从而避免了一次性读取太多数据导致内存溢出的问题。 使用协议4时,需要将文件打开模式指定为'xb',表示以二进制模式打开文件,并且不能使用文本模式: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'xb') as f: pickle.dump(data, f, protocol=4) with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ## 注意事项 在使用pickle模块时,需要注意以下几点: - 序列化和反序列化的对象必须是可序列化的,即不能包含不能序列化的对象。 - 序列化和反序列化的对象必须是相同的类型,否则可能会出现错误。 - 序列化和反序列化的对象必须是可信的,否则可能会被注入恶意代码。 - 不同协议之间的兼容性不同,不同协议之间的序列化和反序列化操作不一定是互逆的。因此,在使用不同协议时,需要注意协议号的兼容性和相应的操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值