C共用体应用实例（3）

最新推荐文章于 2022-04-25 16:27:25 发布
Yi_bunny
最新推荐文章于 2022-04-25 16:27:25 发布
阅读量1.1k
点赞数
分类专栏： C语言应用文章标签： c struct 编译器 date 存储 structure
C语言应用专栏收录该内容
4 篇文章 0 订阅
订阅专栏
转自：http://zhidao.baidu.com/question/274459527.html
1）提高存取效率
   一般处理器是32位的，一次可以从内存中读取32位数据，一般分配给变量地址是4的倍数，如果你定义的结构成员横跨了32位边界，CPU要读取2次。这里就是浪费了时间。

2）为了在不同处理器下兼容。
  早期MIPS处理器只能读取4字节对齐的后的结构，非4倍数地址访问，会造成死机问题。

3）VC一般默认8字节对齐是为了配合64位处理器，8也是4的倍数，因此也适合32位处理器。但就是浪费内存。

4）内存紧张的嵌入式环境，常会需要1字节对齐 。。

typedef union //定义共用体 
{ 
 long i;  //long 四个字节
 int k[5]; //int 四个字节   4*5 = 20
 char c; //char 一个字节：
}DATE; 
上面的结构体是联合：联合的结构体取中间最大的就可以了，因为他们是公用的，所以找到最大的空间，那么小的也能装在大的里面，如果你取小的，那么大的就不能装在小的里面了；
分析一下：上面最大的是：20
struct date //定义结构体 
{ 
 int cat; //int 四个字节
 DATE cow; //DATE 一个联合体：20个字节
 double dog; //double 8个字节
}too; 
//上面的结构体不是联合的，所以：就应该是4+20+8 = 32

因此答案就是：20+32 =52

我个人觉得如果你要对结构体了解的话，这个事远远不够的
比如说：
struct date //定义结构体 
{ 
 int cat; //int 四个字节
 DATE cow; //DATE 一个联合体：20个字节
 double dog; //double 8个字节

         char a;
}too; 
如果考虑对齐的话：
我在上面的结构体里加了一个char a，那么现在结构体多大呢  你说是53，54，56，这样其实都是对的?为什么呢？
因为这个要取决于你的机器是按什么对齐的。
看下面的一段代码：

#pragma pack(push)
#pragma pack(n)
struct date //定义结构体 
{ 
 int cat; //int 四个字节
 DATE cow; //DATE 一个联合体：20个字节
 double dog; //double 8个字节
char a;
}too; 
#pragma pack(pop)
对于这个结构体：对齐方式就取决于#pragma pack(n)中n的取值了，如果n=4,那么上面的结构体就是：56，如果n = 1,那么就是53，n=2那么就是54，切忌这里的N只能为：1，2 ，  4，  8
不过现在的计算机的内存都很大了，不需要节省内存，一般都是四个字节对齐的。默认的是四个字节，但是在嵌入式领域里，一般都是按一个字节对齐的。

下面为了加深你的了解：给你点资料。呵呵




DATE maxx; 
#pragma pack(pop)


int main() 
{ 
printf("%d",sizeof(struct date)+sizeof(maxx)); /*相当于struct date这个结构体所占空间大小加上DATE max这个结构体所占空间的大小。*/ 
return 0;
} 






这是初学者问得最多的一个问题，所以这里有必要多费点笔墨。让我们先看一个*
结构*体：


struct S1
{
char c;
int i;
};
问*sizeof*(s1)*等*于多少？聪明的你开始思考了，char占1个字节，int占4个字
节，那么加起

来就应该是5。是这样吗？你在你机器上试过了吗？也许你是对的，但很可能你是
错的！V

C6中按默认设置得到的结果为8。
Why？为什么受伤的总是我？
请*不*要沮丧，我们来好好琢磨一下*sizeof*的定义——*sizeof*的结果*等*于对象
或者类型所占

的内存字节数，好吧，那就让我们来看看S1的内存分配情况：
S1 s1 = {  a , 0xFFFFFFFF };
定义上面的变量后，加上断点，运行程序，观察s1所在的内存，你发现了什么？
以我的VC6.0为例，s1的地址为0x0012FF78，其数据内容如下：
0012FF78: 61 CC CC CC FF FF FF FF
发现了什么？怎么中间夹杂了3个字节的CC？看看MSDN上的说明：
When applied to a structure type or variable, *sizeof* returns the
actual size,

which may include padding bytes inserted for alignment.
原来如此，这就是传说中的字节对齐啊！一个重要的话题出现了。
为什么需要字节对齐？计算机组成原理教导我们这样有助于加快计算机的取数速
度，否则

就得多花指令周期了。为此，编译器默认会对*结构*体进行处理（*实际*上其它地
方的数据变

量也是如此），让宽度为2的基本数据类型（short*等*）都位于能被2整除的地址
上，让宽度

为4的基本数据类型（int*等*）都位于能被4整除的地址上，以此类推。这样，两
个数中间就

可能需要加入填充字节，所以整个*结构*体的*sizeof*值就增长了。
让我们交换一下S1中char与int的位置：
struct S2
{
int i;
char c;
};
看看*sizeof*(S2)的结果为多少，怎么还是8？再看看内存，原来成员c后面仍然有
3个填充字

节，这又是为什么啊？别着急，下面总结规律。

字节对齐的细节*和*编译器实现相关，但一般而言，满足三个准则：
1) *结构*体变量的首地址能够被其最宽基本类型成员的大小所整除；
2) *结构*体每个成员相对于*结构*体首地址的偏移量（offset）都是成员大小的
整数倍，如有

需要编译器会在成员之间加上填充字节（internal adding）；
3) *结构*体的总大小为*结构*体最宽基本类型成员大小的整数倍，如有需要编译
器会在最末一

个成员之后加上填充字节（trailing padding）。
对于上面的准则，有几点需要说明：
1) 前面*不*是说*结构*体成员的地址是其大小的整数倍，怎么又说到偏移量了
呢？因为有了第

1点存在，所以我们就可以只考虑成员的偏移量，这样思考起来简单。想想为什么。
*结构*体某个成员相对于*结构*体首地址的偏移量可以通过宏offsetof()来获得，
这个宏也在

stddef.h中定义，如下：
#define offsetof(s,m) (size_t)&(((s *)0)->m)
例如，想要获得S2中c的偏移量，方法为
size_t pos = offsetof(S2, c);// pos*等*于4
2) 基本类型是指前面提到的像char、short、int、float、double这样的内置数据
类型，

这里所说的“数据宽度”就是指其*sizeof*的大小。由于*结构*体的成员可以是复合
类型，比

如另外一个*结构*体，所以在寻找最宽基本类型成员时，应当包括复合类型成员的
子成员，

而*不*是把复合成员看成是一个整体。但在确定复合类型成员的偏移位置时则是将
复合类型

作为整体看待。
这里叙述起来有点拗口，思考起来也有点挠头，还是让我们看看例子吧（具体数值
仍以VC

6为例，以后*不*再说明）：
struct S3
{
char c1;
S1 s;
char c2
};
S1的最宽简单成员的类型为int，S3在考虑最宽简单类型成员时是将S1“打散”看
的，所以

S3的最宽简单类型为int，这样，通过S3定义的变量，其存储空间首地址需要被4整
除，整

个*sizeof*(S3)的值也应该被4整除。
c1的偏移量为0，s的偏移量呢？这时s是一个整体，它作为*结构*体变量也满足前
面三个准则

，所以其大小为8，偏移量为4，c1与s之间便需要3个填充字节，而c2与s之间就*不
*需要了，

所以c2的偏移量为12，算上c2的大小为13，13是*不*能被4整除的，这样末尾还得
补上3个填

充字节。最后得到*sizeof*(S3)的值为16。
通过上面的叙述，我们可以得到一个公式：
*结构*体的大小*等*于最后一个成员的偏移量加上其大小再加上末尾的填充字节数
目，即：


*sizeof*( struct ) = offsetof( last item ) + *sizeof*( last item ) +
*sizeof*( trail

ing padding )

到这里，朋友们应该对*结构*体的*sizeof*有了一个全新的认识，但*不*要高兴得
太早，有一个

影响*sizeof*的重要参量还未被提及，那便是编译器的pack指令。它是用来调整*
结构*体对齐

方式的，*不*同编译器名称*和*用法略有*不*同，VC6中通过#pragma pack实现，
也可以直接修改

/Zp编译开关。#pragma pack的基本用法为：#pragma pack( n )，n为字节对齐
数，其取值

为1、2、4、8、16，默认是8，如果这个值比*结构*体成员的*sizeof*值小，那么
该成员的偏移

量应该以此值为准，即是说，*结构*体成员的偏移量应该取二者的最小值，公式如
下：
offsetof( item ) = min( n, *sizeof*( item ) )
再看示例：
#pragma pack(push) // 将当前pack设置压栈保存
#pragma pack(2)// 必须在*结构*体定义之前使用
struct S1
{
char c;
int i;
};
struct S3
{
char c1;
S1 s;
char c2
};
#pragma pack(pop) // 恢复先前的pack设置
计算*sizeof*(S1)时，min(2, *sizeof*(i))的值为2，所以i的偏移量为2，加上
*sizeof*(i)*等*于

6，能够被2整除，所以整个S1的大小为6。
同样，对于*sizeof*(S3)，s的偏移量为2，c2的偏移量为8，加上*sizeof*(c2)*等
*于9，*不*能被

2整除，添加一个填充字节，所以*sizeof*(S3)*等*于10。
现在，朋友们可以轻松的出一口气了，

还有一点要注意，“空*结构*体”（*不*含数据成员）的大小*不*为0，而是1。试想
一个“*不*占

空间”的变量如何被取地址、两个*不*同的“空*结构*体”变量又如何得以区分呢？
于是，“

空*结构*体”变量也得被存储，这样编译器也就只能为其分配一个字节的空间用于
占位了。

如下：
struct S5 { };
*sizeof*( S5 ); // 结果为1


8. 含位域*结构*体的*sizeof*
前面已经说过，位域成员*不*能单独被取*sizeof*值，我们这里要讨论的是含有位
域的*结构*体

的*sizeof*，只是考虑到其特殊性而将其专门列了出来。
C99规定int、unsigned int*和*bool可以作为位域类型，但编译器几乎都对此作了
扩展，允

许其它类型类型的存在。
使用位域的主要目的是压缩存储，其大致规则为：
1) 如果相邻位域字段的类型相同，且其位宽之*和*小于类型的*sizeof*大小，则
后面的字段将

紧邻前一个字段存储，直到*不*能容纳为止；
2) 如果相邻位域字段的类型相同，但其位宽之*和*大于类型的*sizeof*大小，则
后面的字段将

从新的存储单元开始，其偏移量为其类型大小的整数倍；
3) 如果相邻的位域字段的类型*不*同，则各编译器的具体实现有差异，VC6采取*
不*压缩方式

，Dev-C++采取压缩方式；
4) 如果位域字段之间穿插着非位域字段，则*不*进行压缩；
5) 整个*结构*体的总大小为最宽基本类型成员大小的整数倍。

还是让我们来看看例子。
示例1：
struct BF1
{
char f1 : 3;
char f2 : 4;
char f3 : 5;
};
其内存布局为：
|_f1__|__f2__|_|____f3___|____|
|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|
0 3   7 8   1316
位域类型为char，第1个字节仅能容纳下f1*和*f2，所以f2被压缩到第1个字节中，
而f3只能

从下一个字节开始。因此*sizeof*(BF1)的结果为2。
示例2：
struct BF2
{
char f1 : 3;
short f2 : 4;
char f3 : 5;
};
由于相邻位域类型*不*同，在VC6中其*sizeof*为6，在Dev-C++中为2。
示例3：
struct BF3
{
char f1 : 3;
char f2;
char f3 : 5;
};
非位域字段穿插在其中，*不*会产生压缩，在VC6*和*Dev-C++中得到的大小均为3。


9. 联合体的*sizeof*
*结构*体在内存组织上是顺序式的，联合体则是重叠式，各成员共享一段内存，所
以整个联

合体的*sizeof*也就是每个成员*sizeof*的最大值。*结构*体的成员也可以是复合
类型，这里，

复合类型成员是被作为整体考虑的。
所以，下面例子中，U的*sizeof*值*等*于*sizeof*(s)。
union U
{
int i;
char c;
S1 s;
};