offsetof 详解

最新推荐文章于 2024-06-22 23:47:02 发布

dongzhongshu

最新推荐文章于 2024-06-22 23:47:02 发布

阅读量4.3k

点赞数 2

分类专栏： linux 文章标签：编译器 null 存储

本文链接：https://blog.csdn.net/dongzhongshu/article/details/5631510

版权

linux 专栏收录该内容

39 篇文章 1 订阅

订阅专栏

offsetof 宏

在 <stddef.h> 中定义了个 offsetof(s,m)宏，这个宏用来取得结构体中元素的偏移量很方便，下面是此宏的具体定义：

#define offsetof(s, m) (size_t)&(((s *)0)->m)

ofssetof(s, m) 其中，s 是结构体名，m 是它的一个成员。s 和 m 同是宏 offsetof() 的形参，这个宏返回的是结构体 s 的成员 m 在结构体中的偏移地址。

(s *)0 : 这里的用法实际上是欺骗了编译器，使编译器认为 "0" 就是一个指向 s 结构体的指针(地址)，还句话说 s 结构体就是位于 0x0 这个地址处。

(s *)0-> m : 自然就是指向这个结构体的 m 元素。

&((s *)0)->m : 表示 m 元素的地址。这里，如上面所说，因为编译器认为结构体 s 被认为是处于 0x0 地址处，所以 m 的地址自然的就是 m 在 s 中的偏移地址了。

最后将这个偏移值转化为 size_t 类型。

可能会感到迷惑，这样强制转换后的结构指针怎么可以用来访问结构体字段？呵呵，其实这个表达式根本没有也不打算访问m字段。ANSIC标准允许任何值为0的常量被强制转换成任何一种类型的指针，并且转换结果是一个NULL指针，因此((s*)0)的结果就是一个类型为s*的NULL指针。如果利用这个NULL指针来访问s的成员当然是非法的，但&(((s*)0)->m)的意图并非想存取s字段内容，而仅仅是计算当结构体实例的首址为((s*)0)时m字段的地址。聪明的编译器根本就不生成访问m的代码，而仅仅是根据s的内存布局和结构体实例首址在编译期计算这个(常量)地址，这样就完全避免了通过NULL指针访问内存的问题。又因为首址的值为0，所以这个地址的值就是字段相对于结构体基址的偏移。

size_t是针对系统定制的一种数据类型。它不是固定位数，在不同的系统里这个值都有可能不同( 它实际上是 unsigned int 类型 )；而且在内存里，对于数据是高位对齐存储还是低位对齐存储各系统都不一样。所以，为了提高代码的可移植性，就有必要定议这样的数据类型。一般这种类型都会定义到它具体占几位内存等。当然，有些是编译器或系统已经给定义好的。具体要查看技手册。

10月29日