深入理解指针(1)——从内存到指针的完整指南

目录

引言:为什么指针如此重要?

一、内存与地址:计算机的“宿舍楼”模型

1.1 内存的基本单位

1.2 计算机的编址机制

二、指针变量:地址的“容器”

2.1 取地址操作符(&)

2.2 指针变量的声明与使用

2.2.1 指针变量的声明

2.2.2 指针变量的使用

2.2.3 指针变量的大小

三、指针类型:内存访问的 “标尺” 与 “权限卡”

3.1 指针的解引用

3.2 指针 +- 整数

3.3 void*指针

四、const修饰指针:保护数据的"守卫"

4.1 const修饰变量

4.2 const修饰指针

五、指针运算:内存的“导航系统”

5.1 指针 +- 整数

5.2 指针 - 指针

5.3 指针的关系运算

六、野指针:程序里的 “不定时炸弹”

6.1 野指针成因

6.1.1 指针未初始化

6.1.2 指针越界访问

6.1.3 指针指向的空间释放

6.2 如何规避野指针

6.2.1 指针初始化

6.2.2 小心指针越界

6.2.3 指针变量不再使用时,及时置NULL,指针使用之前检查有效性

6.2.4 避免返回局部变量的地址

七、assert断言:程序的"自动检查员"

八、传值调用 vs 传址调用

总结


引言:为什么指针如此重要?

指针是C语言的灵魂,也是许多程序员学习路上的"拦路虎"。理解指针不仅关系到C语言的掌握程度,更是理解计算机内存模型的关键。本文将从最基础的内存概念出发,带你彻底掌握指针的本质。

一、内存与地址:计算机的“宿舍楼”模型

1.1 内存的基本单位

假如你想去找朋友玩,而朋友所在的宿舍楼里,有100个房间,房间却没有编号,你想找到他,就得一个一个房间去找,这样效率就会很低。但是如果我们给这些房间根据楼层位置全都编上号,这样我们就可以根据朋友所给的编号快速找到房间。

计算机也是如此,为了高效管理,计算机中的内存被划分为一个个内存单元,每个内存单元都有唯一的地址编号,有了这个编号,CPU就可以快速找到一个内存空间。这里每个内存单元的大小取一个字节。

我们可以类比一下,每个内存单元相当于一个学生宿舍,一个字节空间里面能放8个比特位,就好比同学们住的八人间,每个人是一个比特位。

生活中我们把门牌号也叫地址,在计算机中我们把内存单元的编号也称为地址。C语言中给地址起了新的名字:指针。所以我们可以这样理解:内存单元的编号 == 地址 == 指针

1.2 计算机的编址机制

计算机中的编址,并不是把每个字节的地址记录下来,而是通过硬件设计完成的。

比如钢琴、吉他上面没有“多瑞咪发嗦啦”这样的信息,但演奏者照样能够准确找到每一个琴弦的每一个位置,这是因为制造商已经在乐器硬件层面上设计好了,并且所有的演奏者都知道。本质是一种约定出来的共识!硬件编址也是如此。

⾸先,必须理解,计算机内是有很多的硬件单元,而硬件单元是要互相协同⼯作的。所谓的协 同,至少相互之间要能够进行数据传递。但是硬件与硬件之间是互相独立的,那么如何通 信呢?答案很简单,用"线"连起来。

而CPU和内存之间也是有大量的数据交互的,所以,两者必须也用线连起来。

不过,我们今天关心⼀组线,叫做地址总线。我们可以简单理解,32位机器有32根地址总线, 每根线只有两态,表示0,1【电脉冲有无】,那么 ⼀根线,就能表示2种含义,2根线就能表示4种含 义,依次类推。32根地址线,就能表示2^32(约42亿)种含义,每⼀种含义都代表⼀个地址,这就是为什么32位系统最大支持4GB内存的原因。地址信息被下达给内存,在内存上,就可以找到 该地址对应的数据,将数据在通过数据总线传入CPU内寄存器。

二、指针变量:地址的“容器”

2.1 取地址操作符(&)

在C语言中创建变量就是向内存申请空间:

#include <stdio.h>

int main() {
    int a = 10;  // 向内存申请4个字节存储整数10
    printf("变量a的地址:%p\n", &a);
    return 0;
}

上述的代码就是创建了整型变量a,内存中申请4个字节,⽤于存放整数10,其中每个字节都是有地址的,上图中这四个字节的地址分别为: 0x012FF9F4、0x012FF9F5、0x012FF9F6、0x012FF9F7

那我们要怎么得到a的地址呢?这里就要用到一个操作符(&)- 取地址操作符

#include <stdio.h>

int main() {
    int a = 10; 
    &a; //取出a的地址
    printf("变量a的地址:%p\n", &a);
    return 0;
}

&a取出的是a所占4个字节中地址较小的字节的地址,我们只要知道了第一个字节的地址,后面字节的地址我们自然也就能知道了。

2.2 指针变量的声明与使用

2.2.1 指针变量的声明

地址也是一个数值,有时我们也需要把它存储起来,这时就需要指针变量了

我们先来看声明:

#include<stdio.h>

int main() {
    int a = 10;
    int *pa = &a;  // 定义指针变量pa,存储a的地址
     
    return 0;
}

我们可以这样理解,pa的类型是int*,星号*说明pa是指针变量,而int是说明pa指向的是整形类型的对象

2.2.2 指针变量的使用

地址保存起来后该怎么使用呢?这里就需要用到解引用操作符(*),我们来看代码:

#include <stdio.h>

int main() {
    int a = 10;
    int *pa = &a;  // 定义指针变量pa,存储a的地址
    
    printf("a的值:%d\n", a);        // 直接访问
    printf("通过指针访问:%d\n", *pa); // 间接访问
    
    *pa = 20;  // 通过指针修改变量值
    printf("修改后a的值:%d\n", a);
    
    return 0;
}

上述代码中,*pa 的意思就是通过pa中存放的地址,找到指向的空间, *pa其实就是a变量了;所以*pa = 20,这个操作符是把a改成了20。

2.2.3 指针变量的大小

前面的内容我们了解到,32位机器假设有32根地址总线,每根地址线出来的电信号转换成数字信号后是1或者0,那我们把32根地址线产生的2进制序列当做⼀个地址,那么⼀个地址就是32个bit位,需要4个字节才能存储。

如果指针变量是用来存放地址的,那么指针变量的大小就得是4个字节的空间才可以。

同理64位机器,假设有64根地址线,⼀个地址就是64个⼆进制位组成的⼆进制序列,存储起来就需要 8个字节的空间,指针变量的大小就是8个字节。

我们来看以下代码:

int main() {

    printf("short* 大小: %zd字节\n", sizeof(short*));
    printf("char* 大小: %zd字节\n", sizeof(char*));
    printf("int*  大小: %zd字节\n", sizeof(int*));
    printf("double*大小: %zd字节\n", sizeof(double*));

    return 0;
}

在x86的环境下运行的结果为:

由此我们也可以得出结论,指针变量的大小取决于地址的大小,与指针类型无关。

在32位平台下,所有指针都是4个字节

在64位平台下,所有指针都是8个字节

三、指针类型:内存访问的 “标尺” 与 “权限卡”

从上面的分析中,我们可以得出,在同一平台下,指针变量的大小与指针类型无关,那么为什么还会有各种各样的指针类型呢?他们有什么意义呢?

3.1 指针的解引用

对比以下两段代码,观察内存的变化:

通过调试,我们分别得到以下结果:

      

调试我们可以看到,代码1会将n的4个字节全部改为0,但是代码2只是将n的第⼀个字节改为0。

结论:指针的类型决定了,对指针解引用的时候有多大的权限(一次可以访问几个字节)。

如例子,char*的指针解引用只能访问一个字节,而int*的指针解引用可以访问四个字节。

3.2 指针 +- 整数

我们来看以下代码:

int main()
{
	int n = 10;
	char* pc = (char*)&n;
	int* pi = &n;

	printf("n的地址为:   %p\n", &n);
	printf("pc的地址为:  %p\n", pc);
	printf("pc+1的地址为:%p\n", pc + 1);
	printf("pi的地址为:  %p\n", pi);
	printf("pi+1的地址为:%p\n", pi + 1);

	return 0;
}

运行结果如下:

我们可以看出, char* 类型的 指针变量+1 跳过1个字节, int* 类型的 指针变量+1 跳过了4个字节。 这就是指针变量的类型差异带来的变化。

结论:指针的类型决定了指针向前或者向后走一步有多大的距离。

3.3 void*指针

在指针类型中有一种特殊的类型是 void* 类型的,可以理解为无具体类型的指针(或者叫泛型指 针),这种类型的指针可以用来接受任意类型地址。

但是也有局限性, void* 类型的指针不能直接进行指针的+-整数和解引用的运算,因为它仅仅起到了存储一个内存地址的作用,它并不知道这个地址上的数据是int、float、结构体还是其他任何类型。

我们可以将任何类型的指针赋值给一个void*指针,无需强制类型转换,但是如果我们要使用它,必须先进行强制转换。

来看以下代码:

int main()
{
	int a = 10;
	float b = 3.14;
	struct Person { char name[20]; int age; };
	struct Person p;

	void* ptr;

	//通用赋值
	ptr = &a;      // 合法,int* 赋给 void*
	ptr = &b;      // 合法,float* 赋给 void*
	ptr = &p;      // 合法,struct Person* 赋给 void*

	//使用
	ptr = &a;
	//int value = *ptr;      //错误!编译器不知道ptr指向什么类型,无法解引用。
	int value = *(int*)ptr;  //正确!先将ptr强制转换为int*,然后解引用。

	return 0;
}

⼀般 void* 类型的指针是使用在函数参数的部分,用来接收不同类型数据的地址,这样的设计可以 实现泛型编程的效果,使得⼀个函数来处理多种类型的数据,这一点后面我还会再讲。

四、const修饰指针:保护数据的"守卫"

4.1 const修饰变量

变量是可以修改的,如果把变量的地址交给⼀个指针变量,通过指针变量也可以修改这个变量。 但是如果我们希望⼀个变量加上⼀些限制,不能被修改,怎么做呢?这就是const的作用。

const是C语言的一个关键字,它是一个类型修饰符,用于告诉编译器,某个变量的值在初始化不应该被修改。

来看以下代码:

当我们在变量n前加上const修饰后,编译器就报错了。

n本质是变量,只不过被const修饰后,在语法上加了限制,只要我们在代码中对n进行修改,就不符合语法规则,就报错,致使没法直接修改n。

但是如果我们绕过n,使用n的地址,去修改n就能做到了

int main()
{
	const int n = 0;
	printf("n = %d\n", n);

	int* p = &n;
	*p = 20;
	printf("n = %d\n", n);

	return 0;
}

代码的结果为:

通过指针我们成功修改了n的值,但是既然我们用const修饰n,我们就是希望n不能被修改,如果p拿到n的地址就能修改n,这样就打破了const的限制,这是不合理的,所以应该让 p拿到n的地址也不能修改n,那接下来怎么做呢?

4.2 const修饰指针

我们通过以下代码来分析:

int main() {
    int a = 10, b = 20;

    // 1. 无const修饰
    int* p1 = &a;
    *p1 = 100;  // 合法,修改指向的内容
    p1 = &b;    // 合法,修改指针本身

    // 2. const在*左边 - 保护内容
    const int* p2 = &a;
    // *p2 = 100;  // 非法,不能修改指向的内容
    p2 = &b;      // 合法,可以修改指针本身

    // 3. const在*右边 - 保护指针
    int* const p3 = &a;
    *p3 = 100;    // 合法,可以修改指向的内容
    // p3 = &b;    // 非法,不能修改指针本身

    // 4. 两边都有const - 全保护
    const int* const p4 = &a;
    // *p4 = 100;  // 非法,不能修改内容
    // p4 = &b;    // 非法,不能修改指针

    return 0;
}

结论:

  • const在*左边:保护内容(不能通过指针修改指向的数据)

  • const在*右边:保护指针(不能让指针指向其他地方)

五、指针运算:内存的“导航系统”

指针的运算分为三种,分别是:

• 指针+- 整数

• 指针-指针

• 指针的关系运算

5.1 指针 +- 整数

因为数组在内存中是连续存放的,我们只要知道第一个元素的地址,顺藤摸瓜就能找到后面的所有元素。

#include <stdio.h>

int main() {
    int arr[5] = {10, 20, 30, 40, 50};
    int *p = arr;
    
    printf("p指向: %d, 地址: %p\n", *p, p);
    printf("p+1指向: %d, 地址: %p\n", *(p+1), p+1);
    printf("p+2指向: %d, 地址: %p\n", *(p+2), p+2);
    
    return 0;
}

结果为:

指针运算的特点

  • 指针+1不是地址值+1,而是加上所指向类型的大小

  • char* + 1 → 地址+1字节

  • int* + 1 → 地址+4字节(32位系统)

5.2 指针 - 指针

 C语言中,两个指针相减的结果是 “两个指针之间的元素个数”,而非物理内存地址的直接差值(字节),其本质是基于指针指向的数据类型大小进行换算后的 “逻辑距离”。

两个指针相减时,编译器会自动执行以下计算:

指针差值 = (指针A的地址 - 指针B的地址)➗ sizeof(指针指向的类型)

指针相减的操作仅在两个指针指向 “同一数组、同一动态内存块或同一容器的连续元素” 时才有意义

5.3 指针的关系运算

#include <stdio.h>

int main() {
    int arr[5] = {1, 2, 3, 4, 5};
    int *start = arr;
    int *end = arr + 5;
    
    // 正向遍历
    int *p = start;
    while (p < end)  //指针的大小比较
    {
        printf("%d ", *p);
        p++;
    }
    printf("\n");
    
    // 反向遍历
    p = end - 1;
    while (p >= start) //指针的大小比较
    {
        printf("%d ", *p);
        p--;
    }
    printf("\n");
    
    return 0;
}

结果:

上面代码实现的功能是分别正向反向打印数组,我们这里while循环的条件使用的就是指针的关系比较,其实指针的关系运算的本质就是比较他们所指向的内存地址的高低

和指针相减一样,指针的关系运算只有在两个指针指向同一数组或连续内存块时,其结果才是有意义且符合定义的。

六、野指针:程序里的 “不定时炸弹”

概念: 野指针就是指针指向的位置是不可知的(随机的、不正确的、没有明确限制的),使用野指针可能会导致程序崩溃、数据损坏等严重问题。

6.1 野指针成因

6.1.1 指针未初始化

6.1.2 指针越界访问

6.1.3 指针指向的空间释放

6.2 如何规避野指针

6.2.1 指针初始化

如果明确指针指向哪里就明确赋值地址,若不知道,可以给指针赋值NULL;

NULL是C语言中定义的一个标识符常量,值是0,0也是地址,这个地址是无法使用的,读写该地址会报错。

int main()
{
 int num = 10;

 //明确指向有效内存
 int*p1 = &num;

 //初始化为NULL
 int*p2 = NULL;

 return 0;
}

6.2.2 小心指针越界

一个程序向内存申请了哪些空间,通过指针也就只能访问哪些空间,不能超出范围访问,超出了就是越界访问。

6.2.3 指针变量不再使用时,及时置NULL,指针使用之前检查有效性

当指针变量指向⼀块区域的时候,我们可以通过指针访问该区域,后期不再使用这个指针访问空间的时候,我们可以把该指针置为NULL。因为约定俗成的一个规则就是:只要是NULL指针就不去访问, 同时使用指针之前可以判断指针是否为NULL。

6.2.4 避免返回局部变量的地址

七、assert断言:程序的"自动检查员"

assert是一个强大的调试工具,可以在运行时检查程序状态。

上面代码在程序运行到这⼀行语句时,验证变量 p 是否等于 NULL 。如果确实不等于 NULL ,程序继续运行,否则就会终止运行,并且给出报错信息提示。

assert() 宏接受⼀个表达式作为参数。如果该表达式为真(返回值非零), assert() 不会产生任何作用,程序继续运行。如果该表达式为假(返回值为零), assert() 就会报错,在标准错误流 stderr 中写入⼀条错误信息,显示没有通过的表达式,以及包含这个表达式的文件名和行号。使用时需包含头文件assert.h

使用 assert() 有几个好处:它不仅能自动标识文件和出问题的行号,还有⼀种无需更改代码就能开启或关闭 assert() 的机制。如果已经确认程序没有问 题,不需要再做断言,就在 #include 语句的前面,定义⼀个宏 NDEBUG 。

然后,重新编译程序,编译器就会禁用文件中所有的 assert() 语句。如果程序又出现问题,可以移 除这条 #define NDBUG 指令(或者把它注释掉),再次编译,这样就重新启用了assert() 语句。

assert() 的缺点是,因为引⼊了额外的检查,增加了程序的运行时间。

⼀般我们可以在 Debug 中使用,在 Release 版本中选择禁用 assert 就行,在 VS 这样的集成开 发环境中,在 Release 版本中,直接就是优化掉了。这样在debug版本写有利于程序员排查问题, 在 Release 版本不影响用户使用时程序的效率。

#include <stdio.h>
//#define NDEBUG    //可随时禁用
#include <assert.h>

// 安全的指针使用函数
void safe_print(int *ptr) {
    assert(ptr != NULL);  // 如果ptr为NULL,程序终止并报错
    printf("值:%d\n", *ptr);
}

int main() {
    int value = 42;
    int *ptr = &value;
    
    safe_print(ptr);  // 正常执行
    safe_print(NULL); // 触发assert,程序终止
    
    return 0;
}

八、传值调用 vs 传址调用

学习指针的目的是用指针解决问题,那什么问题必须用指针呢?我们先来看一个经典问题。

写⼀个函数,交换两个整型变量的值。

没学指针前,我们可能会这样写:

但我们得出的结果确是这样的:

我们明显看到,代码并没有实现交换值的功能,这其实在我们学习函数的时候就知道了,Swap函数在使用的时候,是把变量本身直接传递给了函数,这种传递方式也叫传值调用。其本质是实参传递给形参的时候,形参会单独创建⼀份临时空间来接收实参,对形参的修改不影响实参。

那我们要怎么做呢?

我们现在要解决的就是当调用Swap函数的时候,Swap函数内部操作的就是main函数中的a和b,直接将a和b的值交换了。那么就可以使用指针了,在main函数中将a和b的地址传递给Swap函数,Swap 函数里面通过地址间接的操作main函数中的a和b,并达到交换的效果就好了。

结果:

我们可以看到这里顺利完成了任务,这里调用Swap函数的时候是将变量的地址传递给了函数,这种函数调用方式叫:传址调用。

传址调用,可以让函数和主调函数之间建立真正的联系,在函数内部可以修改主调函数中的变量;所以未来函数中只是需要主调函数中的变量值来实现计算,就可以采用传值调用。如果函数内部要修改主调函数中的变量的值,就需要传址调用。

总结

指针是C语言中最强大也最容易误用的特性。理解指针的关键在于:

  1. 理解内存模型:指针就是内存地址

  2. 明确类型作用:指针类型决定了解引用权限和运算步长

  3. 善用const保护:让代码更安全可靠

  4. 警惕野指针:养成良好的指针使用习惯

  5. 掌握传址调用:理解函数参数传递的本质

掌握这些基础概念后,我们将在下一篇文章中深入探讨指针与数组的密切关系。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值