该结构大致如下:
struct TestStruct
{
int data1;
char data2;
char data3;
};
对应的Python代码:
import struct
s = struct.unpack("icc", buf) #buf是从网络接收的字节流
结果却报“Unpack str size does not match format”错。
很明显是C++ struct产生的size和Python解码所需的不同。于是检查C++的struct size:
printf ("size=%d\n", sizeof(TestStruct));
结果得8。
而
struct.calcsize("icc")
结果却是6。
仔细想想,icc这种排列方式在字段间的确不会产生padding字节,也就是说,python的结果是对的。但为什么C++的结果会是8呢?原来C++的字节对齐,除了struct内部需要字节对齐之外,struct变量本身也是需要字节对齐的,这是为了当生成一个struct数组的时候仍然能够保证所有字段的字节对齐。因此,像icc这种本身没有padding,但整体需要padding的情形,编译器会在整个struct的末尾加上padding字节(在这里是2个字节),也正是这2个字节导致了Python的解码错误。
幸亏Python已经考虑到了这个问题,在Python struct module document的最后一段的Hint