前言
这两天写一个高并发内存池的项目时,遇到了一个关于二级指针的问题,剖析清楚后发觉有必要记录一下,这让我加深了对于C/C++中指针的理解(果然学到老活到老)。
问题的分析
在我的内存池项目中,有一个需求是需要将分配出去的 T 类型(泛型类型)大小的内存块回收起来挂在一根链表上,图示如下:
_freeList是头指针,后面连着的每一块内存块都是回收回来的 T 类型大小的内存块。
但此时会有一个问题,先来看代码,这个回收函数的实现:
逻辑上其实很好明白,代码中注释也给的很足,但是困扰我的问题在于其中第一个 if 语句中的这一行代码:
*(void**)obj = nullptr;
可以看到这里是先将obj强制类型转换为一个二级指针,然后再解引用获得一个一级指针,然后令其指向空,这是头指针为空的情况下需要干的事情。
首先要明确这样做的目的:
因为分配内存时我们是按 T 泛型类型大小来进行分配的(也就是一个定长内存池),此时如果_freeList为空,则说明此时这条链表还一个空闲内存块都没挂上,那么就将当前回收回来的这块 obj 内存块给挂到这条链表上,要实现这样的操作,那么 obj 内存空间中就必须要有至少一个指针大小以上的空间(否则没办法使用指针来进行另一块内存地址的指向),也就是上图中内存块中绿色的部分,其表示一个指针。
此时的问题是,为了程序的可移植性,我们必须要考虑这个指针大小的问题,因为在32位系统环境下指针大小为 4 个字节,而64位环境下指针大小为 8 个字节,我们可以写比较繁琐的冗余判断,但是没有这个必要。
上面的代码中展示了更精妙的做法,即可以将 obj 强转成一个二级指针后再解引用,这样就会得到一个指针大小的空间,直接用
*(void**)obj = nullptr,直接用这个赋值,此时对指针赋值就完全取决于平台了。
那么为什么这样做就可以呢?涉及到对二级指针void**概念的剖析。
前置知识
在进行详细的剖析前,需要补充几个知识点。
强制类型转换的机制
将 obj 强转成为二级指针的过程究竟发生了什么,其实很简单。
在上面的代码中,obj 本身是一个指针,保存着我们需要回收的内存块的内存地址,我们其实不管对其进行一级指针强转还是二级指针强转,并不影响其内存储的值,这里先举一个例子,解释什么是强制类型转换:
首先看强制转换的语法:
(type_name) expression
当执行强制类型转换时,编译器会尝试将 expression 的值按照 type_name 指定的类型进行解释或表示,一般会涉及到对二进制表示的重新解释。
程序示例:
运行结果如下:
所谓强制类型转换,无非是将存储在同一块内存空间中的内容让编译器按照不同数据类型的格式给展现出来而已,如上图所示,我们声明的变量是char类型的,但是将其强转成整形之后,输出则变成了97,但其实 c 变量所存储的机器指令是没有变化的,只是编译器将这些机器指令按照不同的数据类型给翻译出了不一样的值——即上文说的编译器对二进制表示的重新解释。
关于void、void*以及void**
这里还要补充一下关于 void 类型的知识:
在C/C++语言中,void 类型是一个特殊的类型,它没有具体的表示形式,通常用于表示无类型或空类型。
void 类型主要出现在函数的返回类型、函数参数以及指针声明中。
1. void 类型
返回值
当函数不返回任何值时,其返回类型应声明为 void。例如:
void print_hello() {
printf("Hello, World!\n");
}
这个函数不返回任何值,所以它的返回类型是 void。
函数参数
void 也可以作为函数的参数类型,但通常只出现在函数指针的定义中,表示这个函数不接受任何参数。例如:
void (*function_ptr)(void);
这里,function_ptr 是一个指向函数的指针,该函数不接受任何参数并返回 void。
2. void* 类型
void* 是一个指向任意类型的指针。它本身并不携带任何类型信息,但可以指向任何数据类型。由于 void* 没有类型信息,因此不能直接解引用(即不能直接通过 *ptr 来访问它所指向的值),需要先将其转换为相应类型的指针。
用途
void* 常常用于以下场景:
通用指针函数:如 malloc 和 free 这样的内存分配函数,它们返回指向所分配内存区域的 void* 指针,该内存区域可以存储任何类型的数据。
作为函数参数:当需要传递一个通用指针到函数中,而不知道这个指针具体指向什么类型时。
类型转换:可以将任何类型的指针转换为 void*,然后再转换回原来的类型(或其他类型),这在某些情况下用于隐藏类型信息或实现泛型编程。
示例:
int x = 10;
void *ptr = &x; // 将 int* 转换为 void*
int *int_ptr = (int *)ptr; // 将 void* 转换回 int*
printf("%d\n", *int_ptr); // 输出 10
3. void** 类型
void** 是一个指向 void* 的指针,即双重指针。它用于存储指向任意类型指针的指针。这在某些高级用法中很有用,比如处理指针的数组或者动态分配指针数组。
用途
处理指针数组:当你有一个指针数组,而这些指针又可以指向不同类型的数据时。
函数参数:当函数需要接受一个指向指针的指针时,例如,用于修改外部指针的指向。
示例:
void *ptrs[3]; // 一个 void* 类型的数组
void **ptr_to_ptrs = ptrs; // ptr_to_ptrs 指向 ptrs 数组的首地址
// 假设我们有一个函数,它接受一个 void** 并设置它指向某个 void*
void set_void_ptr(void **ptr, void *value) {
*ptr = value;
}
int main() {
int x = 10;
set_void_ptr((void **)&ptrs[0], &x); // 设置 ptrs[0] 指向 x 的地址
// ... 其他操作 ...
return 0;
}
在这个例子中,set_void_ptr 函数接受一个 void** 类型的参数,并设置它所指向的 void* 变量的值。注意,在调用 set_void_ptr 时,我们需要将 &ptrs[0] 强制转换为 void** 类型,因为数组名在大多数情况下会隐式转换为指向其第一个元素的指针(这里是 void*),但我们需要的是一个指向这种指针的指针(即 void**)。
总结一下,void、void* 和 void** 在C语言中分别表示无类型、任意类型指针和指向任意类型指针的指针,它们提供了处理通用指针和动态内存分配的灵活性。但在使用它们的时候需要格外小心,确保类型安全,避免未定义行为。
问题的解决
然后再来看我们之前提到的二级指针的代码:
*(void**)obj = nullptr;
所以这里也是一样的,obj 是一个指针变量(本身就是一个一级指针变量),保存着待回收的内存空间的地址,此时我们将其强制转换为void**,也就是一个二级指针变量,但其所存储的值是不会发生改变的(二级指针也是指针,一级指针一样是指针嘛,就是同一种二进制表示形式,不过存储的内容有区分罢了,二级指针存储的是一个一级指针的地址,而一级指针存储的是一个变量的地址),因为二级指针与一级指针一样,同样是指针类型(只要是指针,系统平台一样的情况下大小都是一样的,不管什么类型的指针),所以 obj 被编译器解释的时候展示的依然会是原来一样的地址值,我们可以写一个程序验证一下:
运行结果如下:
可以看见不管转成一级指针(应该说 obj 本身就是个一级指针变量所以一级转一级是转了个寂寞…倒也不是完全没转,起码数据类型变了,从int*变成了void*)还是二级指针,p 这个指针变量所存储的地址值都不会发生改变,同理 obj 这个变量也不会发生改变。
但其实这里的二级指针用什么类型的都可以,因为不会解引用到最后的void,所有的指针大小都取决于是32位还是64位,也就是说*(int**)obj = nullptr也是可以的,最终得到的都是一个指针大小的空间,同时这样就可以不用再判断一下当前平台位数了。
因为void** 是一个指向 void* 的指针,所以对void**指针进行解引用操作时,可以拿到一个一级指针变量的地址。
假设现在 obj 的值就是0x3f4af412,按照上面说的,void**只是个类型,转成void**之后 obj 的值依然是0x3f4af412,但是此时我们再对强转后的obj 进行解引用,就可以拿到 0x3f4af412 这块地址空间中存储的内容(也就是待回收的 T 类型变量的内容)了。
但因为我们将 obj 所指向 T 类型的空间大小给强转成了 void* 类型,所以我们取出来 0x3f4af412 地址的时候就变成了平台的4/8字节大小的指针类型了,也就是说会从 0x3f4af412 地址开始取四个字节或者八个字节出来以表示一个指针也就是我们刚转的void*类型,相当于从原来 obj 变量所指向的 T 类型大小内存空间的前面砍了四个或者八个字节出来进行表示一个指针。
可以写个程序测试一下:
运行结果如下:
因为分配给某一普通变量内存地址的时候肯定是连续的嘛,整个过程图示大致如下:
假设上图中一个方块为一个字节,可以看到上图右侧在经过强制类型转换之后,原先整形的两个字节内存就被抛弃了(也就是在这里不再有用,将存储着垃圾值等待操作系统进行下一次内存分配),我们也就成功的做到了从原先整形起始地址 0x100 到 0x103 总共 4 个字节的内存空间中,通过强制类型转换拿到了前两个字节 0x100 到 0x101 这两块内存空间来进行操作。
同理,对于本文提出的问题:*(void**)obj = nullptr ,其转换过程也与上图类似,大致如下,注意32位系统下指针大小为4个字节,64位环境下指针大小为8个字节,这里我图方便以4个字节大小的指针为例进行图示,8字节也是一样的分析方法:
上图中,obj 此时是个一级指针,存储的是一个 T 类型变量的地址。
那么现在我们将 obj 这个一级指针强转成二级指针,图示如下:
可以发现没有变化,因为在系统环境不变的情况下,不管任意类型的指针变量大小都是一样的,占四个或者八个字节。
但是有一点是有变化的,此时上图的含义变了:此时的 obj 指针变量为一个二级指针变量,其存储的是一个一级指针的地址,因此 原先存储的 T 类型的内存地址 0x123456 在强制类型转换之后被编译器解释成了一个一级指针的地址,此时再对 obj 进行解引用操作,那么肯定能够得到一个一级指针,如果是32位系统下,其占四个字节,图示如下:
此时我们就可以拿到前面四个字节来当指针使用了。
我们也可以写测试代码来验证一下这个事情:
运行结果如下:
可以看到如我们所说,强转成一级指针和二级指针时指针变量 p 的值都是相同,这印证了我们上文所说的内容,另外对二级指针进行解引用时也能够得到变量 a 的值,只不过应该是 cout 输出格式限制的原因,只输出了个 0xa ,但至少我们可以看出和变量 a 是有关系的。
结束
上面应该写的蛮清楚的了,但是如果对于二级指针是指针的指针还有一点迷糊的话,可以看一下下面的例子帮助理解: