最近在尝试使用python编写处理HDLC数据文件的程序,先后使用了两个模块,分别是bitstring和bitarray。处理HDLC数据,首先需要找到文件中的‘0x7E’,在两个模块中分别有对应的方法。
bitstring
在这个模块中,可以把数据文件读取为Bits、BitArray或者BitStream类,然后使用findall方法查找数据文件中所有的7E位置。注意,findall返回的是generator,我使用list对generator进行了强制转换。
bitarray
在这个模块中,把数据文件读取为bitarray类,使用search方法查找7E位置,得到的就是list。
所用时间比较
6.73MB数据文件,bitstring模块需要86.5S,bitarray模块需要0.8S。
512MB数据文件,bitarray模块需要96S。
最终,我选择使用bitarray模块进行二进制文件的处理,不仅速度快,而且有一些方法比较省事,比如bytereverse、tobytes等。