python - 常用模块 - 序列化相关模块

把数据序列化可以更加方便的在程序之间传输

在python中,常用json和pickle两个模块来对数据序列化:

json模块:

  json,用于字符串 和 python数据类型间进行转换

  Json 模块提供了四个功能:dumps、dump、loads、load

  json.dump() 将数据通过特殊的形式转换为所有程序语言都认识的字符串,并写入文件
  json.dumps() 将数据通过特殊的形式转换为所有程序语言都认识的字符串

  json.dump和json.dumps很不同,json.dump主要用来json文件读写,和json.load函数配合使用。

  json.loads() 加载json文件的内容,并转换为python数据类型

 1 ''' json.dumps 和 json.loads 应用'''
 2 >>> import json
 3 >>> user_info= {
 4     'name':'root',
 5     'age':22,
 6     'job':'python'
 7     }
 8 >>> with open('data_json.txt','w') as f:
 9     f.write(json.dumps(user_info))          #先序列化,再写入文件
10     
12 44   # 这是序列化后单个字符的数量(字典在打印时,每个键值对的值前面会有个空格)
13 >>> len(user_info)
14 3
15 >>> with open('data_json.txt','r') as fr:
16     json.loads(fr.read())       #先从文件读出来,再反序列化
17    
19 {'name': 'root', 'age': 22, 'job': 'python'}
20 >>> 
 1 >>>      '''json.dump 和 json.load使用'''
 2 >>> import json
 3 >>> user_info = {'name': 'root', 'age': 22, 'job': 'python'}
 4 >>> 
 5 >>> with open('data_json1.txt','w') as fw:
 6     json.dump(user_info,fw)         
 7                                #json.dump(要被序列化对象,文件句柄)
 8     
 9 >>> with open('data_json1.txt','r') as fr:
10     json.load(fr) 
11                       #json.load(文件句柄)
12     
13 {'name': 'root', 'age': 22, 'job': 'python'}
14 >>> 

pickle模块:

  pickle,用于python特有的类型 和 python的数据类型间进行转换

  pickle模块提供了四个功能:dumps、dump、loads、load

  pickle.dumps() 将数据通过特殊的形式转换成只有python语言认识的字符串,不需要写入文件
  pickle.dump() 将数据通过特殊的形式转换成只有python语言认识的字符串,并写入文件

  pickle.dump(obj, fw, [,protocol])
    注解:将对象obj保存到文件fw ('w'方式打开的文件句柄)中去。
  pickle.dumps(obj):以字节对象形式返回封装的对象,不需要写入文件中

  pickle.load(fr)
    注解:从file中读取一个字符串,并将它重构为原来的python对象。
    fr : 'r'方式打开的文件句柄,有read()和readline()接口。

  pickle.loads(bytes_object): 从字节对象中读取被封装的对象,并返回

 1 >>>     ''' pickle.dumps 和 pickle.loads 使用'''
 2 >>> import pickle
 3 >>> user_info = {'name': 'root', 'age': 22, 'job': 'python'}
 4 >>> 
 5 >>> with open('data_pickle.txt','wb') as fw:      #用pickle对数据序列化时,要用二进制打开进行读、写
 6     fw.write(pickle.dumps(user_info))
 7   
 9 65
10 >>> with open('data_pickle.txt','rb') as fr:
11     pickle.loads(fr.read())
12 
13     
14 {'name': 'root', 'age': 22, 'job': 'python'}
15 >>> 
 1 >>>        '''pickle.dump 和 pickle.load使用'''
 2 >>> import pickle
 3 >>> user_info = {'name': 'root', 'age': 22, 'job': 'python'}
 4 >>> 
 5 >>> with open('data_pickle1.txt','wb') as fw:
 6     pickle.dump(user_info,fw)
 7 
 8 >>> with open('data_pickle1.txt','rb') as fr:
 9     pickle.load(fr)
10     
11 {'name': 'root', 'age': 22, 'job': 'python'}
12 >>> 

json和pickle两个模块的方法一样,只是在用pickle序列化时,打开文件的方式必须是二进制('wb','rb')

以上利用json或pickle都是序列化一条数据,若要同时序列化多条数据,则pickle和json都很麻烦了(两种方式操作过程一样)

>>>                      '''用 pickle 序列化多条数据'''
>>> import pickle
>>> 
>>> user_info = {'name': 'root', 'age': 22, 'job': 'python'}
>>> user_list = ['root','admin','xsec']
>>> job_list = ['python','php','js']
>>>
>>> with open('more_data_pickle.txt','wb') as fw:
    fw.write(pickle.dumps(user_info))
    fw.write(pickle.dumps(user_list))
    fw.write(pickle.dumps(job_list))
    
65
42
40
>>> with open('more_data_pickle.txt','rb') as fr:
    pickle.loads(fr.read())
    pickle.loads(fr.read())
    pickle.loads(fr.read())               #用dumps可以序列化多条数据,但是用loads反序列化时,报错了

{'name': 'root', 'age': 22, 'job': 'python'}
Traceback (most recent call last):
  File "<pyshell#83>", line 3, in <module>
    pickle.loads(fr.read())
EOFError: Ran out of input

>>> fr = open('more_data_pickle.txt','rb')
>>> pickle.loads(fr.read())
{'name': 'root', 'age': 22, 'job': 'python'}
>>> pickle.loads(fr.read())
Traceback (most recent call last):
  File "<pyshell#86>", line 1, in <module>
    pickle.loads(fr.read())
EOFError: Ran out of input
 
>>> with open('more_data_pickle.txt','wb') as fw:          #用dump和load成功序列化和反序列化多条数据
    pickle.dump(user_info,fw)
    pickle.dump(user_list,fw)
    pickle.dump(job_list,fw)

>>> with open('more_data_pickle.txt','rb') as fr:
    pickle.load(fr)
    pickle.load(fr)
    pickle.load(fr)        #在生产时这样load不知道到底要load多少次才能取到想要的数据
    
{'name': 'root', 'age': 22, 'job': 'python'}        #按照dump的先后顺序,依次load (入单向队列,先进先出)
['root', 'admin', 'xsec']
['python', 'php', 'js']
>>> 

由上面可知,在序列化时问题还不大,可是当我们在读取数据时,感觉就是毫无条理,不知道合适才能取到我们想要的数据。由此,我们有必要学习下面这个模块

shelve 模块 

  shelve模块是一个简单的通过key,value形式将内存数据通过文件持久化的模块,可以持久化任何pickle可以支持的python数据格式

  ( shelve 的实质:对pickle再一次封装)

  shelve较于pickle优点:
    在dump多条数据时,pickle需要dump多次,其在取时,也要对应load多次(先进先出)
    而shelve在持久化多条数据之后,只需要根据不同的key就可以调用不同的数据

 1 >>> 
 2 >>> import shelve
 3 >>> user_info = {'name': 'root', 'age': 22, 'job': 'python'}
 4 >>> user_list = ['root', 'admin', 'xsec']
 5 >>> job_list = ['python', 'php', 'js']
 6 >>>                                      #用shelve序列化数据
 7 >>> so = shelve.open('more_data_shelve.txt')     #打开一个用来存储序列化后的数据的文件(不需要打开方式)
 8 >>> so['u_i'] = user_info
 9 >>> so['u_l'] = user_list         #其中的键名('u_i'...)是自定义的,存数据不要求顺序,后面取数据也不要求顺序
10 >>> so['j_l'] = job_list
11 >>> so.close()           #存完了记得关闭文件
12 >>> 
#反序列化数据 13 >>> so1 = shelve.open('more_data_shelve.txt') #打开之前存储序列化后的数据的文件,同样不要打开方式 14 >>> so1['u_l'] 15 ['root', 'admin', 'xsec'] 16 >>> so1['j_l'] #可以通过键名,只取想要的数据,不需要全部反序列化 17 ['python', 'php', 'js'] 18 >>> so1['u_i'] 19 {'name': 'root', 'age': 22, 'job': 'python'} 20 >>> so1.close() #关闭文件 21 >>>

 

转载于:https://www.cnblogs.com/xtsec/p/6680535.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python的pickle模块是用来实现序列化的,即将Python中的对象转换成字节流,方便存储和传输。pickle模块支持多种协议,其中协议0是最早的版本,协议1和协议2是Pyhton2中引入的,协议3是Python3.0中引入的,协议4是Python3.4中引入的,每个协议都有其特点和适用范围。 下面我们来详细了解一下pickle模块的使用方法和各个协议的特点。 ## 基本用法 pickle模块提供了dumps、dump、loads和load四个函数,分别用来进行序列化和反序列化操作。其中dumps和loads函数可以直接将对象转换成字节流或将字节流转换成对象,而dump和load函数则可以将对象序列化到文件或从文件中反序列化对象。 ### 序列化Python对象转换成字节流的过程称为序列化,可以使用dumps函数实现: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} bytes_data = pickle.dumps(data) print(bytes_data) ``` 输出结果为: ``` b'\x80\x04\x95\x17\x00\x00\x00\x00\x00\x00\x00}\x94(\x8c\x04name\x94\x8c\x03Tom\x94\x8c\x03age\x94K\x12\x8c\x06gender\x94\x8c\x04male\x94u.' ``` 可以看到,data字典被转换成了一串二进制的字节流。 ### 反序列化 将字节流转换成Python对象的过程称为反序列化,可以使用loads函数实现: ```python import pickle bytes_data = b'\x80\x04\x95\x17\x00\x00\x00\x00\x00\x00\x00}\x94(\x8c\x04name\x94\x8c\x03Tom\x94\x8c\x03age\x94K\x12\x8c\x06gender\x94\x8c\x04male\x94u.' data = pickle.loads(bytes_data) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ### 文件操作 除了使用dumps和loads函数进行序列化和反序列化操作外,pickle模块还提供了dump和load函数用于将对象序列化到文件或从文件中反序列化对象。 将对象序列化到文件: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wb') as f: pickle.dump(data, f) ``` 从文件中反序列化对象: ```python import pickle with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` ## 协议0 协议0是最早的版本,它使用ASCII码来表示序列化后的对象,因此序列化后的数据比较大。使用协议0时,可以指定文件打开模式为't',表示以文本模式打开文件: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wt') as f: pickle.dump(data, f, protocol=0) with open('data.pkl', 'rt') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'age': 18, 'gender': 'male', 'name': 'Tom'} ``` ## 协议1 协议1和协议2是Python2中引入的,它们使用更紧凑的二进制格式表示序列化后的对象。协议1可以指定文件打开模式为'wb',表示以二进制模式打开文件: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wb') as f: pickle.dump(data, f, protocol=1) with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ## 协议2 协议2是协议1的改进版本,它支持新的对象类型,如集合、字典等。在Python2中,协议2是默认使用的协议,如果不指定协议号,则使用协议2。 在Python3中,pickle模块默认使用协议3,但仍然可以使用协议2: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wb') as f: pickle.dump(data, f, protocol=2) with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ## 协议3 协议3是Python3.0中引入的,它支持更多的对象类型,如bytes、bytearray、set等。在Python3中,协议3是默认使用的协议,因此可以省略protocol参数: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'wb') as f: pickle.dump(data, f) with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ## 协议4 协议4是Python3.4中引入的,它支持更多的对象类型,如memoryview、tuple等。协议4还支持从流中读取指定长度的数据,从而避免了一次性读取太多数据导致内存溢出的问题。 使用协议4时,需要将文件打开模式指定为'xb',表示以二进制模式打开文件,并且不能使用文本模式: ```python import pickle data = {'name': 'Tom', 'age': 18, 'gender': 'male'} with open('data.pkl', 'xb') as f: pickle.dump(data, f, protocol=4) with open('data.pkl', 'rb') as f: data = pickle.load(f) print(data) ``` 输出结果为: ``` {'name': 'Tom', 'age': 18, 'gender': 'male'} ``` ## 注意事项 在使用pickle模块时,需要注意以下几点: - 序列化和反序列化的对象必须是可序列化的,即不能包含不能序列化的对象。 - 序列化和反序列化的对象必须是相同的类型,否则可能会出现错误。 - 序列化和反序列化的对象必须是可信的,否则可能会被注入恶意代码。 - 不同协议之间的兼容性不同,不同协议之间的序列化和反序列化操作不一定是互逆的。因此,在使用不同协议时,需要注意协议号的兼容性和相应的操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值