C/C+语言struct深层探索

最新推荐文章于 2024-01-23 20:39:40 发布

百度蜘蛛-小伙

最新推荐文章于 2024-01-23 20:39:40 发布

阅读量463

点赞数

分类专栏：技术资料文章标签： struct 语言 alignment c++ 编译器 class

本文链接：https://blog.csdn.net/flamerry/article/details/547160

版权

技术资料专栏收录该内容

35 篇文章 0 订阅

订阅专栏

作者：宋宝华         出处： PConline

1. struct 的巨大作用
　　面对一个人的大型 C/C++ 程序时，只看其对 struct 的使用情况我们就可以对其编写者的编程经验进行评估。因为一个大型的 C/C++ 程序，势必要涉及一些 ( 甚至大量 ) 进行数据组合的结构体，这些结构体可以将原本意义属于一个整体的数据组合在一起。从某种程度上来说，会不会用 struct ，怎样用 struct 是区别一个开发人员是否具备丰富开发经历的标志。

　　在网络协议、通信控制、嵌入式系统的 C/C++ 编程中，我们经常要传送的不是简单的字节流（ char 型数组），而是多种数据组合起来的一个整体，其表现形式是一个结构体。

　　经验不足的开发人员往往将所有需要传送的内容依顺序保存在 char 型数组中，通过指针偏移的方法传送网络报文等信息。这样做编程复杂，易出错，而且一旦控制方式及通信协议有所变化，程序就要进行非常细致的修改。

　　一个有经验的开发者则灵活运用结构体，举一个例子，假设网络或控制协议中需要传送三种报文，其格式分别为 packetA 、 packetB 、 packetC ：

struct structA
{
int a;
char b;
};

struct structB
{
char a;
short b;
};

struct structC
{
int a;
char b;
float c;
}
　　优秀的程序设计者这样设计传送的报文：

struct CommuPacket
{
int iPacketType; 　　 // 报文类型标志
union 　　　　　　 // 每次传送的是三种报文中的一种，使用 union
{
  struct structA packetA;
  struct structB packetB;
  struct structC packetC;
}
};
　　在进行报文传送时，直接传送 struct CommuPacket 一个整体。

　　假设发送函数的原形如下：

// pSendData ：发送字节流的首地址， iLen ：要发送的长度
Send(char * pSendData, unsigned int  iLen);
发送方可以直接进行如下调用发送 struct CommuPacket 的一个实例 sendCommuPacket ：
Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );
假设接收函数的原形如下：
// pRecvData ：发送字节流的首地址， iLen ：要接收的长度
// 返回值：实际接收到的字节数
unsigned int Recv(char * pRecvData, unsigned int  iLen) ；
　　接收方可以直接进行如下调用将接收到的数据保存在 struct CommuPacket 的一个实例 recvCommuPacket 中：

Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );
　　接着判断报文类型进行相应处理：

switch(recvCommuPacket. iPacketType)
{
    case PACKET_A:
     …     //A 类报文处理
    break;
    case PACKET_B:
     …　   //B 类报文处理
    break;
    case PACKET_C:
     …    //C 类报文处理
    break;
}
　　以上程序中最值得注意的是

Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );
Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );
　　中的强制类型转换： (char *)&sendCommuPacket 、 (char *)&recvCommuPacket ，先取地址，再转化为 char 型指针，这样就可以直接利用处理字节流的函数。

　　利用这种强制类型转化，我们还可以方便程序的编写，例如要对 sendCommuPacket 所处内存初始化为 0 ，可以这样调用标准库函数 memset() ：

memset((char *)&sendCommuPacket,0, sizeof(CommuPacket));

2. struct 的成员对齐
　　 Intel 、微软等公司曾经出过一道类似的面试题：

1. #include <iostream.h>

2. #pragma pack(8)
3. struct example1
4. {
5. short a;
6. long b;
7. };

8. struct example2
9. {
10. char c;
11. example1 struct1;
12. short e;
13. };
14. #pragma pack()

15. int main(int argc, char* argv[])
16. {
17. example2 struct2;

18. cout << sizeof(example1) << endl;
19. cout << sizeof(example2) << endl;
20. cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2)
<< endl;

21. return 0;
22. }
　　问程序的输入结果是什么？

　　答案是：

8
16
4

　　不明白？还是不明白？下面一一道来：

2.1 自然对界

　　 struct 是一种复合数据类型，其构成元素既可以是基本数据类型（如 int 、 long 、 float 等）的变量，也可以是一些复合数据类型（如 array 、 struct 、 union 等）的数据单元。对于结构体，编译器会自动进行成员变量的对齐，以提高运算效率。缺省情况下，编译器为结构体的每个成员按其自然对界（ natural alignment ）条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储，第一个成员的地址和整个结构的地址相同。

　　自然对界 (natural alignment) 即默认对齐方式，是指按结构体的成员中 size 最大的成员对齐。

　　例如：

struct naturalalign
{
char a;
short b;
char c;
};
　　在上述结构体中， size 最大的是 short ，其长度为 2 字节，因而结构体中的 char 成员 a 、 c 都以 2 为单位对齐， sizeof(naturalalign) 的结果等于 6 ；

　　如果改为：

struct naturalalign
{
char a;
int b;
char c;
};
　　其结果显然为 12 。

2.2 指定对界

　　一般地，可以通过下面的方法来改变缺省的对界条件：

　　· 使用伪指令 #pragma pack (n) ，编译器将按照 n 个字节对齐；
　　· 使用伪指令 #pragma pack () ，取消自定义字节对齐方式。

　　注意：如果 #pragma pack (n) 中指定的 n 大于结构体中最大成员的 size ，则其不起作用，结构体仍然按照 size 最大的成员进行对界。

　　例如：

#pragma pack (n)
struct naturalalign
{
char a;
int b;
char c;
};
#pragma pack ()
　　当 n 为 4 、 8 、 16 时，其对齐方式均一样， sizeof(naturalalign) 的结果都等于 12 。而当 n 为 2 时，其发挥了作用，使得 sizeof(naturalalign) 的结果为 8 。

　　在 VC++ 6.0 编译器中，我们可以指定其对界方式，其操作方式为依次选择 projetct > setting > C/C++ 菜单，在 struct member alignment 中指定你要的对界方式。

　　另外，通过 __attribute((aligned (n))) 也可以让所作用的结构体成员对齐在 n 字节边界上，但是它较少被使用，因而不作详细讲解。

2.3 面试题的解答

　　至此，我们可以对 Intel 、微软的面试题进行全面的解答。

　　程序中第 2 行 #pragma pack (8) 虽然指定了对界为 8 ，但是由于 struct example1 中的成员最大 size 为 4 （ long 变量 size 为 4 ），故 struct example1 仍然按 4 字节对界， struct example1 的 size 为 8 ，即第 18 行的输出结果；

　　 struct example2 中包含了 struct example1 ，其本身包含的简单数据成员的最大 size 为 2 （ short 变量 e ），但是因为其包含了 struct example1 ，而 struct example1 中的最大成员 size 为 4 ， struct example2 也应以 4 对界， #pragma pack (8) 中指定的对界对 struct example2 也不起作用，故 19 行的输出结果为 16 ；

　　由于 struct example2 中的成员以 4 为单位对界，故其 char 变量 c 后应补充 3 个空，其后才是成员 struct1 的内存空间， 20 行的输出结果为 4 。

3. C 和 C++ 间 struct 的深层区别
　　在 C++ 语言中 struct 具有了“类”　的功能，其与关键字 class 的区别在于 struct 中成员变量和函数的默认访问权限为 public ，而 class 的为 private 。

　　例如，定义 struct 类和 class 类：

struct structA
{
char a;
…
}
class classB
{
      char a;
      …
}
　　则：

struct A a;
a.a = 'a';    // 访问 public 成员，合法
classB b;
b.a = 'a';    // 访问 private 成员，不合法
　　许多文献写到这里就认为已经给出了 C++ 中 struct 和 class 的全部区别，实则不然，另外一点需要注意的是：

　　 C++ 中的 struct 保持了对 C 中 struct 的全面兼容（这符合 C++ 的初衷——“ a better c ”），因而，下面的操作是合法的：

// 定义 struct
struct structA
{
char a;
char b;
int c;
};
structA a = {'a' , 'a' ,1};    //   定义时直接赋初值
　　即 struct 可以在定义的时候直接以 { } 对其成员变量赋初值，而 class 则不能，在经典书目《 thinking C++ 2nd edition 》中作者对此点进行了强调。

4. struct 编程注意事项
　　看看下面的程序：

1. #include <iostream.h>

2. struct structA
3. {
4. int iMember;
5. char *cMember;
6. };

7. int main(int argc, char* argv[])
8. {
9. structA instant1,instant2;
10.char c = 'a';

11. instant1.iMember = 1;
12. instant1.cMember = &c;

13.instant2 = instant1;

14.cout << *(instant1.cMember) << endl;

15.*(instant2.cMember) = 'b';

16. cout << *(instant1.cMember) << endl;

17. return 0;
}
　　 14 行的输出结果是： a
　　 16 行的输出结果是： b

　　 Why? 我们在 15 行对 instant2 的修改改变了 instant1 中成员的值！

　　原因在于 13 行的 instant2 = instant1 赋值语句采用的是变量逐个拷贝，这使得 instant1 和 instant2 中的 cMember 指向了同一片内存，因而对 instant2 的修改也是对 instant1 的修改。

　　在 C 语言中，当结构体中存在指针型成员时，一定要注意在采用赋值语句时是否将 2 个实例中的指针型成员指向了同一片内存。

　　在 C++ 语言中，当结构体中存在指针型成员时，我们需要重写 struct 的拷贝构造函数并进行“ = ”操作符重载。