新手必看：C语言深入理解指针（1）

最新推荐文章于 2024-10-02 06:00:47 发布

versatile_zpc

最新推荐文章于 2024-10-02 06:00:47 发布

阅读量1k

点赞数 20

分类专栏：大学计算机基础新手必看 C语言基础代码文章标签： c语言开发语言

本文链接：https://blog.csdn.net/versatile_zpc/article/details/141466424

版权

新手必看同时被 3 个专栏收录

7 篇文章 0 订阅

订阅专栏

C语言基础代码

7 篇文章 0 订阅

订阅专栏

大学计算机基础

6 篇文章 0 订阅

订阅专栏

1. 内存和地址

1.1 内存

在讲内存和地址前，我们先举一个生活中的案例：

如果有一栋公寓楼，你住在里面，有100个房间，没房间号，你的朋友找你玩就只能一间一间挨着找，效率很低。如果给房间编上号，你的朋友就能直接通过房间号找到你，效率很高。

如果把上面例子放在计算机里面，又是怎么样呢？

计算机的CPU（中央处理器）处理的数据是在内存中读取的处理后的数据也会放回在内存中，当我们买电脑时，电脑上内存是8GB/16GB/32GB等，这些内存空间如何高效管理呢？

其实也是把内存划分为一个个内存单元，每个内存单元的大小取一个字节。

计算机常见的内存单位（补充）：

一个比特位可以存储一个二进制的位1或0。

1. bit - 比特位

2. Byte - 字节

3. KB

4. MB

5. GB

6. TB

7. PB

1Byte = 8bit

1Kb = 1024Byte

1MB = 1024KB

1GB = 1024MB

1TB = 1024GB

......

其中，每个内存单元相当于一个学生宿舍，一个字节空间里面能放8个比特位，相当于同学们住的八人间，每个人是一个比特位。

每个内存单元也都有一个编号(相当于宿舍房间的门牌号)，有了这个内存单元编号，CPU就可以快速找到一个内存空间。

生活中我们把门牌号叫做地址，在计算机中我们把内存单元的编号也叫做地址。C语言中给地址起了一个新的名字“指针”。

所以我们可以理解为：

内存单元的编号==地址==指针

1.2 究竟该如何理解编址

CPU访问内存某个空间，必须知道这个字节空间在内存的什么位置，而因为内存中字节很多，就需要给其编址，就像给宿舍编号一样。

计算机中的编制，不是把地址记录下来，而是通过硬件设计来完成的。

计算机内有很多的硬件单元，而硬件单元是要互相协同工作的。所谓的协同，至少相互之间要能进行数据传递的。

但是硬件之间是相互独立的，如何通信呢，就是用“线”连起来。而CPU和内存之间有大量的内存交互，所以，两者也必须用线连接起来。

我们今天关注一组线，“地址总线”。

硬件编制也是如此，我们可以简单理解，32位机器有32跟地址总线，每根线只有两态，表示0和1（电脉冲有无），那么，一根线能表示两种含义，两根线能表示4种含义，以此类推，32根线能表示2^32种含义，每一种含义代表一种地址。

地址被下达给内存，在内存上，就可以找到该地址对应的数据，将数据通过数据总线传入CPU内寄存器。

2. 指针变量和地址

2.1 取地址操作符（&）

理解了内存和地址的关系，我们再回到C语言，在C语言中申请变量就是在向内存申请空间，比如：

上述代码就是创建了整形变量n，向内存申请了4个字节的空间，用于存放整形10，上述图中四个字节的地址分别是：

1. 0x012FFB50

2. 0x012FFB51

3. 0x012FFB52

4. 0x012FFB53

如何得到a的地址呢，这里我们来学习一个操作符'&'，叫做“取地址操作符”

&a取出的地址是a的四个字节中较小的那个地址。

虽然整形变量占用四个地址，但是我们只要知道了第一个字节地址，顺藤摸瓜访问到四个字节的数据也是可行的。

2.2 指针变量和解引用操作符

2.2.1 指针变量

我们通过取地址操作符拿到的是一个数值（00B9FBF0）,这个数值有时候也需要存储起来，方便后期使用，那我们把这样的地址存放在哪里呢，答案是：指针变量中。如下：

指针变量也是变量，这种变量是用来存放地址的放在指针变量中的值都会理解为地址。

2.2.2 如何拆解指针类型

我们看到pa的类型是int*，我们该如何理解指针的类型呢？

1 int a = 10;

2 int* pa = &a;

这里pa左边写的是int* , * 在说明pa是指针变量，而前面的int是在说明pa指向的是整形（int）类型的对象。

如果有一个char类型的变量ch，那么ch的地址要放在什么类型的指针变量中呢？

答案是：‘ char* ’

2.2.3 解引用操作符

我们将地址保存起来未来是要使用的，那么，怎么使用呢？

在现实生活中，我们有房间地址，就可以去房间内拿取物品。

C语言中也一样，我们只要拿到了地址（指针），就可以通过地址（指针）找到地址（指针）所指向的对象，这里必须学习一个操作符叫解引用操作符（*）。

上面42行代码中就使用了解引用操作符，*pa的意思其实就是通过pa中存放的地址，找到指向的空间，所以 *pa 是把 a 改成了 0。

有同学肯定会想直接用 a = 0；不就行了，何必多此一举取出a的地址再解引用呢？这里其实是把a的值的修改交给pa来操作，这样对a的修改就多了一种途径，写代码就能够更灵活，同学们后期就能慢慢理解了。

2.3 指针变量的大小

前面的内容我们了解到，32位机器假设有32跟地址总线，每根地址线出来的电信号转换为数字信号后是0或1，那我们把32跟地址线产生的二进制序列当成一个地址，那么一个地址就是32个比特位，需要4个字节才能存储。

如果指针变量是用来存放地址的，那么指针变量的大小就得是4个字节的大小才可以。

同理，64位机器，假设有64跟地址总线，一个地址就是64个二进制数字组成的二进制序列，存储下来就需要8个字节的空间，指针变量的大小就是8个字节。

可以看出，无论什么类型的指针，在相同平台上，指针大小都是一样的。就好比一个超大别墅和一个小公寓的地址都可能是0xxx，不会说是别墅就会高人一等。

结论：

1. 32位平台上地址是32个比特位，指针大小是4个字节。

2. 64位平台上地址是64个比特位，指针大小是8个字节。

3. 注意指针变量的大小和类型是无关的，只要指针类型的变量，在相同平台下，大小都是相同的。

3. 指针变量的类型和意义

指针变量的大小和类型无关，只要是指针变量，在相同平台下，指针大小都是一样的，为什么还会有各种各样的类型呢？

3.1 指针的解引用

调试我们可以看到，第一个将n全部改成了0，而第二个只是将第一个字节改成了0。

结论：指针的类型决定了，对指针解引用时有多大权限（一次能操作几个字节）。比如，char* 的指针解引用一次能访问1个字节，int* 的指针解引用一次能访问4个字节。

3.2 指针加减整数

写一段代码，观察地址变化

可以看到，int* 类型的的指针变量加一指针跳过了4个字节，char* 的指针变量加一跳过了1个字节。指针加减，其实就是跳过一个指针指向的元素。

结论：指针的类型决定了指针向前或向后走一步有多大（距离）。

3.3 void* 指针

在指针类型中，有一个特殊的类型 void* ，可以理解为无具体类型的指针（或者叫泛型指针），这种类型的指针可以用来接收任意类型地址。但是也有局限性，void*类型的指针不能直接进行指针的加减整数和解引用运算。

如果将int变量的地址放入 char* 类型的指针变量中，部分编译器会报错，但是如果用 void* 类型的指针变量来接收的话，就没有这个问题了。

一般void*类型的指针是使用在函数参数的部分，用来接收不同数据类型的地址，这样的设计就可实现泛型编程的效果。使得一种函数来处理多种类型的数据，在《深入理解指针（4）》中我们会讲解。

4. const修饰指针

4.1 const修饰变量

变量是可以修改的，如果把变量的地址交给一个指针变量，通过指针变量也可以修改这个变量。但是如果我们希望一个变量加上一些限制，不能被修改，怎么做呢这就是const的作用。

上述代码中n是不能被修改的，n的本质是变量，只不过被const 修饰后，在语法上加了限制，只要我们在代码中对n进行修改，就不符合语法规则，会报错，致使没法直接修改 n。

但是我们拿出 n 的地址，通过地址来修改 n 就能做到了，虽然这么做是在打破语法规则。

我们看到 n 确实被修改了，但是我们使用const 的目的就是为了 n 不被修改，但是通过 n 的地址将 n 进行修改显然是有点不太合理，那如何让拿到了 n 的地址也不能修改 n 的值呢？

4.2 const修饰指针变量

一般来讲 const 修饰指针变量，可以放在 * 的左边，也可以在 * 的右边，这是有区别的。

简单来说，const放在*左边就是修饰指针指向的内容，保证指针指向的内容不可通过指针来改变，但是指针变量本身内容可变。

const放在*右边修饰的就是指针变量本身，保证了指针变量的内容不可被修该，但是指针指向的内容可以被改变。

5.指针运算

指针的基本运算有三种：

1. 指针+-整数

2. 指针-指针

3. 指针的关系运算

5.1.指针+-整数

因为数组的元素在内存中是连续存放的，所以我们只要找到第一个元素的地址，就可以顺藤摸瓜找到所有元素。

通过指针加1来依次访问数组的每个元素。

5.2. 指针-指针

指针-指针就是能得到中间的字符个数（注：字符串后隐藏了一个/0）

5.3. 指针的关系运算

6. 野指针

概念：野指针就是指针指向的位置是不可知的（随机的、不正确的、没有明确限制的）。

6.1 野指针成因

6.1.1. 指针未初始化

6.1.2. 指针越界访问

6.1.3. 指针指向的空间释放

6.2 如何规避野指针

6.2.1 指针初始化

如果明确知道指针指向哪里就赋予其地址，如果不知道指针指向哪里，可以给指针赋值NULL。NULL是C语言中定义的一个标识符常量，值0, 0也是地址，这个地址是无法使用的，读写该地址会报错。

初始化如下：

6.2.2 小心指针越界

一个程序向内存申请了哪些空间，通过指针也就能访问哪些空间，不能超出访问范围，超出了就是越界访问。

6.2.3 指针变量不在使用时，及时置NULL，指针使用之前检查有效性

当指针指向一块区域时，我们可以通过指针访问该区域，后期不再使用时，及时置NULL，因为俗成约定的一个规则就是：只要NULL指针不被访问，同时使用指针之前可以判断指针是否为NULL。

我们可以把野指针想象成野狗，放任其不管是非常危险的，找个树拴起来，就相对安全了，给指针给指针变量及时赋值为NULL，其实就是把野狗拴起来，将野指针暂时管理起来。

不过在使用之前。我们也要判断是否为NULL，如果是不能直接使用，如果不是我们再去使用。

6.2.4 避免返回局部变量的地址

造成野指针的第三个例子，不要返回局部变量地址。局部变量在使用中很有可能被销毁。

7. assert断言

assert.h 头文件定义了宏assert()，用于在运行中确保程序符合指定条件，如果不符合，就报错终止7程序运行。这个宏尝尝被称为 “断言”。

上面代码在运行到131行语句时，验证变量p是否等于NULL。如果不等于，程序继续运行，否则就会终止运行，并且给出报错信息提示。

assert() 宏接受一个表达式作为参数。如果该表达式为真（返回值非零），assert()不会产生任何作用，程序继续运行。如果该表达式为假（返回值为零），assert()就会报错，在标准错误流stderr中写入一条错误信息，显示没有通过的表达方式，以及包含这个表达式的文件名和行号。

assert()的使用对程序员是非常友好的，使用assert()有几个好处：它不仅能自动标识文件和出问题的行号，还有一种无需更改代码就可以开启或关闭assert()的机制。如果已经确认程序没有问题，不需要再做断言，就在#include <assert.h> 语句前面，定义一个宏NDEBUG 。