学习编译原理时遇到的习题,结构体的存储空间分配问题。上课时简单讲的对齐原理不足以解决问题,网上搜索后找到了合理解释,经过程序验证觉得可以,记录一下。
原帖地址:https://www.cnblogs.com/bewolf/p/4356903.html
一、为什么结构体计算这么乱?
答案是字节对齐,计算机存储系统中以Byte为单位存储数据,不同数据类型所占的空间不同,如:整型(int)数据占4个字节,字符型(char)数据占一个字 节,
短整型(short)数据占两个字节,等等。计算机为了快速的读写数据,默认情况下将数据存放在某个地址的起始位置,如:整型数据(int)默认存储 在地址能被
4整除的起始位置,字符型数据(char)可以存放在任何地址位置(被1整除),短整型(short)数据存储在地址能被2整除的起始位置。这样字节对齐有助于加快
计算机的取数速度,否则就得多花指令周期了。
二、字节对齐的细节和具体编译器实现相关,但一般而言,满足三个准则:
-
结构体变量的首地址能够被其最宽基本类型成员的大小所整除;
-
结构体每个成员相对于结构体首地址的偏移量都是当前成员大小的整数倍,如有需要编译器会在成员之间加上填充字节;
-
结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要编译器会在最末一个成员之后加上填充字节。
说明:
1、基本类型是指前面提到的像char、short、int、float、double这样的内置数据类型;
2、对于复合数据类型,如结构体嵌套结构体,那么基本类型是指前面提到的像char、short、int、float、double这样的内置数据类型;
3、我认为计算结构体大小的时候,主要用到准则2和准则3,对于准则1是编译器自动完成的,不需要过多理会。
4、C++中类的可以看做是特殊的结构体,所以类的sizeof的计算和结构体是一样的。
具体示例和分析见原帖(CSDN的代码排版好奇怪跟Typora不太一样)
我的示例: