##腌制一缸美味的泡菜
(我们之前学习了文件和文件系统,我们知道从一个文件里面去读取字符串是非常简单的,但是你如果要试图读取出数值的话,那么就要多费点周折了,因为无论你是使用read()方法还是readline()方法,都是返回一个字符串,如果我们希望从字符串中取出数值的话,我们会使用int()或float()函数,把类似于1,2,3或者3.14的字符串强制转换为整型或者浮点型数值,我们一直在讲保存文件,然而当你要保存的数据像列表,字典,集合甚至是类的实例这些更加复杂的数据类型的时候,你就会举手无措了,兴许你可能会把这些都转化为字符串,然后再写入到一个文本文件中保存起来,但是很快你就会发现,把这个过程反过来的时候,也就是从文本文件中恢复数据对象,即把一个字符串恢复成列表,字典,集合,类的实例的时候,你会发现这异常的困难,所幸的是,Python提供了一个标准的模块(pickle)使用这个模块,我们就可以轻松地将列表,字典,集合,类的实例这类复杂的类型转换为二进制文件了。这个模块就是我们要学习的pickle模块了。)
※pickle:pickle就是泡菜、腌菜的意思,它几乎可以把所有Python的对象转换为二进制的形式存放,字节流,这个过程我们称之为 pickling(存放),从二进制的形式转换为对象的过程我们叫做 unpickling(读取)
(要使用pickle模块,先导入,然后创建了列表后,用open的形式把它打开,不输入路径,就在原来的文件打开,文件名后缀名随便,后缀名只是起到一个提醒的作用,他不会影响到你具体写入的是什么格式,因为我们用了pickle的方式保存,为了方便记忆,还是建议使用pkl,然后第二个参数要注意,一定要用wb的形式,即二进制的写入形式,那要往里边放,就用dump方法,第一个参数传入一个对象,第二个参数是倒入的目标文件,就是刚刚打开的文件pickle_file,倒进去之后,和使用普通文件一样,要关闭)
(读取用load()方法,首先先打开,以rb形式打开,二进制的读取形式,如下:)
(我们发现,对于这样一个小列表,进行保存没有多大作用,但是在实际的编程任务中,我们往往会遇到大量的复杂的列表,字典,这时候使用泡菜技术,代码就会显得更加的优雅。)
##温故知新之习题
0. pickle的实质是什么?
答:pickle的实质就是利用一些算法将你的数据对象“腌制”成二进制文件,存储在磁盘上,当然也可以放在数据库或者通过网络传输到另一台计算机上。
1. 使用pickle的什么方法存储数据?
答:pickle.dump(data, file) # 第一个参数是待存储的数据对象,第二个参数是目标存储的文件对象,注意要先使用’wb’的模式open文件哦^_^
2. 使用pickle的什么方法读取数据?
答:pickle.load(file) # 参数是目标存储的文件对象,注意要先使用’rb’的模式open文件哦^_^
3. 使用pickle能不能保存为”*.txt”类型的文件?
答:可以,不过打开后是乱码,因为是以二进制的模式写入的。(例子详见下方动动手第0题)
##动动手
0. 编写一个程序,这次要求使用pickle将文件( record.txt (1.1 KB, 下载次数: 3561) )里的对话按照以下要求腌制成不同文件(没错,是第29讲的内容小改,考考你自己能写出来吗?):
※小甲鱼的对话单独保存为boy_*.txt的文件(去掉“小甲鱼:”)
※小客服的对话单独保存为girl_*.txt的文件(去掉“小客服:”)
※文件中总共有三段对话,分别保存为boy_1.txt, girl_1.txt,boy_2.txt, girl_2.txt, boy_3.txt, gril_3.txt共6个文件(提示:文件中不同的对话间已经使用“==========”分割)
答:
import pickle
def save_file(boy, girl, count):
file_name_boy = 'boy_' + str(count) + '.txt'
file_name_girl = 'girl_' + str(count) + '.txt'
boy_file = open(file_name_boy, 'wb') # 记得一定要加 b 吖
girl_file = open(file_name_girl, 'wb') # 记得一定要加 b 吖
pickle.dump(boy, boy_file)
pickle.dump(girl, girl_file)
boy_file.close()
girl_file.close()
def split_file(file_name):
count = 1
boy = []
girl = []
f = open(file_name)
for each_line in f:
if each_line[:6] != '======':
(role, line_spoken) = each_line.split(':', 1)
if role == '小甲鱼':
boy.append(line_spoken)
if role == '小客服':
girl.append(line_spoken)
else:
save_file(boy, girl, count)
boy = []
girl = []
count += 1
save_file(boy, girl, count)
f.close()
split_file('record.txt')