python数据结构算法题一百零一:与串行端口的数据通信

问题
你想通过串行端口读写数据,典型场景就是和一些硬件设备打交道 (比如一个机器
人或传感器)。
解决方案
尽管你可以通过使用 Python 内置的 I/O 模块来完成这个任务,但对于串行通信
最好的选择是使用 pySerial 包 。这个包的使用非常简单,先安装 pySerial,使用类似下
面这样的代码就能很容易的打开一个串行端口:

ser = serial.Serial('/dev/tty.usbmodem641', # Device name varies
baudrate=9600,
bytesize=8,
parity='N',
stopbits=1)

设备名对于不同的设备和操作系统是不一样的。比如,在 Windows 系统上,你可
以使用 0, 1 等表示的一个设备来打开通信端口”COM0”和”COM1”。一旦端口打开,
那就可以使用 read(),readline() 和 write() 函数读写数据了。例如:

resp = ser.readline()

大多数情况下,简单的串口通信从此变得十分简单。
讨论
尽管表面上看起来很简单,其实串口通信有时候也是挺麻烦的。推荐你使用第三
方包如 pySerial 的一个原因是它提供了对高级特性的支持 (比如超时,控制流,缓冲
区刷新,握手协议等等)。举个例子,如果你想启用 RTS-CTS 握手协议,你只需要给
Serial() 传递一个 rtscts=True 的参数即可。其官方文档非常完善,因此我在这里极
力推荐这个包。
时刻记住所有涉及到串口的 I/O 都是二进制模式的。因此,确保你的代码使用的
是字节而不是文本 (或有时候执行文本的编码/解码操作)。另外当你需要创建二进制编
码的指令或数据包的时候,struct 模块也是非常有用的。
5.21 序列化 Python 对象
问题
你需要将一个 Python 对象序列化为一个字节流,以便将它保存到一个文件、存储
到数据库或者通过网络传输它。
解决方案
对于序列化最普遍的做法就是使用 pickle 模块。为了将一个对象保存到一个文件
中,可以这样做:

data = ... # Some Python object
f = open('somefile', 'wb')
pickle.dump(data, f)

为了将一个对象转储为一个字符串,可以使用 pickle.dumps() :

为了从字节流中恢复一个对象,使用 picle.load() 或 pickle.loads() 函数。比
如:

f = open('somefile', 'rb')
data = pickle.load(f)
# Restore from a string
data = pickle.loads(s)

讨论
对于大多数应用程序来讲,dump() 和 load() 函数的使用就是你有效使用 pickle
模块所需的全部了。它可适用于绝大部分 Python 数据类型和用户自定义类的对象实
例。如果你碰到某个库可以让你在数据库中保存/恢复 Python 对象或者是通过网络传
输对象的话,那么很有可能这个库的底层就使用了 pickle 模块。
pickle 是一种 Python 特有的自描述的数据编码。通过自描述,被序列化后的数
据包含每个对象开始和结束以及它的类型信息。因此,你无需担心对象记录的定义,它
总是能工作。举个例子,如果要处理多个对象,你可以这样做:

>>> f = open('somedata', 'wb')
>>> pickle.dump([1, 2, 3, 4], f)
>>> pickle.dump('hello', f)
>>> pickle.dump({'Apple', 'Pear', 'Banana'}, f)
>>> f.close()
>>> f = open('somedata', 'rb')
>>> pickle.load(f)
[1, 2, 3, 4]
>>> pickle.load(f)
'hello'
>>> pickle.load(f)
{'Apple', 'Pear', 'Banana'}
>>>

你还能序列化函数,类,还有接口,但是结果数据仅仅将它们的名称编码成对应的
代码对象。例如:

>>> import pickle.
>>> pickle.dumps(math.cos)
b'\x80\x03cmath\ncos\nq\x00.'
>>>

当数据反序列化回来的时候,会先假定所有的源数据时可用的。模块、类和函数会
自动按需导入进来。对于 Python 数据被不同机器上的解析器所共享的应用程序而言,
数据的保存可能会有问题,因为所有的机器都必须访问同一个源代码。

pickle 在加载时有一个副作用就是它会自动加载相应模块并构造实例对象。
但是某个坏人如果知道 pickle 的工作原理,
他就可以创建一个恶意的数据导致 Python 执行随意指定的系统命令。
因此,一定要保证 pickle 只在相互之间可以认证对方的解析器的内部使用

有些类型的对象是不能被序列化的。这些通常是那些依赖外部系统状态的对象,
比如打开的文件,网络连接,线程,进程,栈帧等等。用户自定义类可以通过提供
getstate() 和 setstate() 方法来绕过这些限制。如果定义了这两个方法,
pickle.dump() 就会调用 getstate() 获取序列化的对象。类似的,setstate()
在反序列化时被调用。为了演示这个工作原理,下面是一个在内部定义了一个线程但仍
然可以序列化和反序列化的类:

import time
import threading
class Countdown:
def __init__(self, n):
self.n = n
self.thr = threading.Thread(target=self.run)
self.thr.daemon = True
self.thr.start()
def run(self):
while self.n > 0:
print('T-minus', self.n)
self.n -= 1
time.sleep(5)
def __getstate__(self):
return self.n
def __setstate__(self, n):
self.__init__(n)

试着运行下面的序列化试验代码:

>>> c = countdown.Countdown(30)
>>> T-minus 30
T-minus 29
T-minus 28
...
>>> # After a few moments
>>> f = open('cstate.p', 'wb')
>>> import pickle
>>> pickle.dump(c, f)
>>> f.close()

然后退出 Python 解析器并重启后再试验下:

>>> pickle.load(f)
countdown.Countdown object at 0x10069e2d0>
T-minus 19
T-minus 18
...

你可以看到线程又奇迹般的重生了,从你第一次序列化它的地方又恢复过来。
pickle 对于大型的数据结构比如使用 array 或 numpy 模块创建的二进制数组效率
并不是一个高效的编码方式。如果你需要移动大量的数组数据,你最好是先在一个文
件中将其保存为数组数据块或使用更高级的标准编码方式如 HDF5 (需要第三方库的支
持)。
由于 pickle 是 Python 特有的并且附着在源码上,所有如果需要长期存储数据的
时候不应该选用它。例如,如果源码变动了,你所有的存储数据可能会被破坏并且变得
不可读取。坦白来讲,对于在数据库和存档文件中存储数据时,你最好使用更加标准的
数据编码格式如 XML,CSV 或 JSON。这些编码格式更标准,可以被不同的语言支持,
并且也能很好的适应源码变更。
最后一点要注意的是 pickle 有大量的配置选项和一些棘手的问题。对于最常见的
使用场景,你不需要去担心这个,但是如果你要在一个重要的程序中使用 pickle 去做
序列化的话,最好去查阅一下 官方文档 。

  • 18
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值