你:知不知Java如何解析C++通过tcp socket传过来的结构体啊
我:知不知?
不久前,接到一个任务,使用Java写一个flume的TcpSource做为服务端,用于接收C++客户端程序发送的未序列化的C++结构体并解析成Java对象,要完成这个需求的开发,首先需要了解一点点,结构体内存对齐,字节填充,CPU大小端及网络字节序,然后就是一点点反汇编,会写点点C++ /Java代码,会简单的使用tcpdump抓包就OK了
咱们先看下结构体内存对齐
简单点一般结构体内存对齐的2个要素就是:
1. 对于结构体中的每一个成员变量的相对偏移地址要能被min(自身大小,对齐系数)整除
2. 对于结构体的总体大小,要能被min(最大的成员变量大小,对齐系数)整除
有如下代码
反汇编如下
32位系统下gcc编译器默认4字节对齐
由反汇编代码可知编译器
在char a后多填充了3字节(红色方框1),可使int b的相对偏移地址满足要素1,成员变量int b的相对偏移地址0x804a020-0x804a01c=4能被min(int b自身大小4,对齐系数4)=4整除
在char d后多填充了1字节(红色方框2),可使结构体总体大小满足要素2,结构体的总体大小12能被min(最大的成员变量int b的大小4,对齐系数4)=4整除
为什么大家要关注结构体的内存对齐?其实内存中的变量都要对齐,32位系统下malloc返回的地址都是4字节对齐的
因为结构体的内存对齐会影响结构体内存占用的大小,在声明一个结构体时,有意的调整各个变量的位置,有时可减少甚至避免由于内存对齐导致的字节填充ÿ