C++primer之sizeof

Boy_Ge

于 2015-10-25 01:32:28 发布

阅读量298

点赞数

分类专栏： C++ 文章标签： C++ sizeof

C++ 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

使用sizeof的结果部分地依赖所涉及的类型：

对char类型或值为char 类型的表达式做sizeof操作保证得到1
对引用类型做sizeof操作将返回存放此引用类型对象所需要的内存空间的大小。也就是被引用的对象占用对少内存，引用就占用多少内存
对指针做sizeof操作将返回存放指针所需要的内存大小，如果需要获取该指针所指向的对象的大小，则必须对该指针进行解引用。
对数组做sizeof操作等效于将对其元素类型做sizeof操作的结果乘上数组的元素个数。
sizeof(string)总是返回为4.string的实现在各库中可能有所不同，但是在同一库中相同一点是，无论你的string里放多长的字符串，它的sizeof()都是固定的，字符串所占的空间是从堆中动态分配的，与sizeof()无关。

首先看一下sizeof在msdn上的定义：

    The sizeof keyword gives the amount of storage, in bytes, associated with a variable or a type (including aggregate types). This keyword returns a value of type size_t.

    看到return这个字眼，是不是想到了函数？错了，sizeof不是一个函数，你见过给一个函数传参数，而不加括号的吗？sizeof可以，所以sizeof不是函数。网上有人说sizeof是一元操作符，但是我并不这么认为，因为sizeof更像一个特殊的宏，它是在编译阶段求值的。举个例子：

cout<<sizeof(int)<<endl; // 32位机上int长度为4

cout<<sizeof(1==2)<<endl; // == 操作符返回bool类型，相当于 cout<<sizeof(bool)<<endl;

    在编译阶段已经被翻译为：

cout<<4<<endl;

cout<<1<<endl;

    这里有个陷阱，看下面的程序：

int a = 0;

cout<<sizeof(a=3)<<endl;

cout<<a<<endl;

    输出为什么是4，0而不是期望中的4，3？？？就在于sizeof在编译阶段处理的特性。由于sizeof不能被编译成机器码，所以sizeof作用范围内，也就是()里面的内容也不能被编译，而是被替换成类型。=操作符返回左操作数的类型，所以a=3相当于int，而代码也被替换为：

int a = 0;

cout<<4<<endl;

cout<<a<<endl;

    所以，sizeof是不可能支持链式表达式的，这也是和一元操作符不一样的地方。

    结论：不要把sizeof当成函数，也不要看作一元操作符，把他当成一个特殊的编译预处理。

（3）函数类型

    考虑下面的问题：

int f1(){return 0;};

double f2(){return 0.0;}

void f3(){}

cout<<sizeof(f1())<<endl; // f1()返回值为int，因此被认为是int

cout<<sizeof(f2())<<endl; // f2()返回值为double，因此被认为是double

cout<<sizeof(f3())<<endl; // 错误！无法对void类型使用sizeof

cout<<sizeof(f1)<<endl;   // 错误！无法对函数指针使用sizeof

cout<<sizeoff2<<endl;   // f2，和f2()等价，因为可以看作object，所以括号不是必要的。被认为是double

    结论：对函数使用sizeof，在编译阶段会被函数返回值的类型取代，

4、指针问题

    考虑下面问题：

cout<<sizeof(string)<<endl; // 4

cout<<sizeof(int)<<endl; // 4

cout<<sizof(char****)<<endl; // 4

    可以看到，不管是什么类型的指针，大小都是4的，因为指针就是32位的物理地址。

这里有一个陷阱：

int d = new int[10];

cout<<sizeof(d)<<endl; // 4

    d是我们常说的动态数组，但是他实质上还是一个指针，所以sizeof(d)的值是4。

    再考虑下面的问题：

double (a)[3][6];

cout<<sizeof(a)<<endl;   // 4

cout<<sizeof(a)<<endl;   // 72

cout<<sizeof(a)<<endl; // 24

cout<<sizeof(*a)<<endl; // 4

cout<<sizeof(****a)<<endl; // 8

    a是一个很奇怪的定义，他表示一个指向 double[3][6]类型数组的指针。既然是指针，所以sizeof(a)就是4。

    既然a是执行double[3][6]类型的指针，a就表示一个double[3][6]的多维数组类型，因此sizeof(a)=36sizeof(double)=72。同样的，**a表示一个double*[6]类型的数组，所以sizeof(**a)=6sizeof(double)=24。***a就表示其中的一个元素，也就是double了，所以sizeof(a)=4。至于a，就是一个double了，所以sizeof(**a)=sizeof(double)=8。

8、从union的sizeof问题看cpu的对界

    考虑下面问题：（默认对齐方式）

union u

{

   double a;

   int b;

};

union u2

{

   char a[13];

   int b;

};

union u3

{

   char a[13];

   char b;

};

cout<<sizeof(u)<<endl;   // 8

cout<<sizeof(u2)<<endl;   // 16

cout<<sizeof(u3)<<endl;   // 13

    都知道union的大小取决于它所有的成员中，占用空间最大的一个成员的大小。所以对于u来说，大小就是最大的double类型成员a了，所以sizeof(u)=sizeof(double)=8。但是对于u2和u3，最大的空间都是char[13]类型的数组，为什么u3的大小是13，而u2是16呢？关键在于u2中的成员int b。由于int类型成员的存在，使u2的对齐方式变成4，也就是说，u2的大小必须在4的对界上，所以占用的空间变成了16（最接近13的对界）。

    结论：复合数据类型，如union，struct，class的对齐方式为成员中对齐方式最大的成员的对齐方式。

9、struct的sizeof问题（尽量将相同sizeof的放在一起，貌似能够节省不少的内存空间）

    因为对齐问题使结构体的sizeof变得比较复杂，看下面的例子：(默认对齐方式下)

struct s1

{

   char a;

   double b;

   int c;

   char d;

};

struct s2

{

   char a;

   char b;

   int c;

   double d;

};

cout<<sizeof(s1)<<endl; // 24

cout<<sizeof(s2)<<endl; // 16

    同样是两个char类型，一个int类型，一个double类型，但是因为对界问题，导致他们的大小不同。计算结构体大小可以采用元素摆放法，我举例子说明一下：首先，CPU判断结构体的对界，根据上一节的结论，s1和s2的对界都取最大的元素类型，也就是double类型的对界8。然后开始摆放每个元素。

    对于s1，首先把a放到8的对界，假定是0，此时下一个空闲的地址是1，但是下一个元素d是double类型，要放到8的对界上，离1最接近的地址是8了，所以d被放在了8，此时下一个空闲地址变成了16，下一个元素c的对界是4，16可以满足，所以c放在了16，此时下一个空闲地址变成了20，下一个元素d需要对界1，也正好落在对界上，所以d放在了20，结构体在地址21处结束。由于s1的大小需要是8的倍数，所以21-23的空间被保留，s1的大小变成了24。

    对于s2，首先把a放到8的对界，假定是0，此时下一个空闲地址是1，下一个元素的对界也是1，所以b摆放在1，下一个空闲地址变成了2；下一个元素c的对界是4，所以取离2最近的地址4摆放c，下一个空闲地址变成了8，下一个元素d的对界是8，所以d摆放在8，所有元素摆放完毕，结构体在15处结束，占用总空间为16，正好是8的倍数。

    这里有个陷阱，对于结构体中的结构体成员，不要认为它的对齐方式就是他的大小，看下面的例子：

struct s1

{

   char a[8];

};

struct s2

{

   double d;

};

struct s3

{

   s1 s;

   char a;

};

struct s4

{

   s2 s;

   char a;

};

cout<<sizeof(s1)<<endl; // 8

cout<<sizeof(s2)<<endl; // 8

cout<<sizeof(s3)<<endl; // 9

cout<<sizeof(s4)<<endl; // 16;

    s1和s2大小虽然都是8，但是s1的对齐方式是1，s2是8（double），所以在s3和s4中才有这样的差异。

    所以，在自己定义结构体的时候，如果空间紧张的话，最好考虑对齐因素来排列结构体里的元素。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。