一、预备知识
1.1 C 是什么样的语言
- C 是为了解决眼前问题,由开发现场的人发明的语言。如果不熟悉去使用会造成危险的后果(Dan改良打印机的故事)
- C 原本是为了开发 UNIX 操作系统而设计的语言。最早的 UNIX 是用汇编来写的,UNIX 的开发者 Ken Tompson 开发了B语言,后来他的同事 Dennis Ritchie 对B语言做了改良,被大家称为NB(New B),后来改称为C语言。
1.2 关于指针
- 指向不同数据类型的指针是不一样的(如int *p、double *p),编译器会帮我们记住指针指向什么样的类型。
- 对于指针加减运算,标准只允许指针指向数组内的元素,或者超过数组长度的下一个元素。指针运算的结果也一样。
- 在 C 语言中,对指针进行加 1 运算,地址的值会增加当前指针所指向数据类型的长度。
- 空指针(NULL):
- 空指针是指可以确保没有指向任何一个对象的指针。通常使用宏定义 NULL 来表示空指针常量值(NULL表示0地址,大部分环境下可以用0表示,但也有特例)。
- 空指针确保它和任何非空指针进行比较都不会相等,因此经常作为函数发生异常时的返回值使用。
- 如果每次都使用 NULL 来初始化指针变量,在错误地使用了无效(未初始化)的指针时,我们就可以马上发现潜在的 bug。
- PS:这部分可以对应翁恺老师 9.2 指针运算中的0地址来看。
1.3 关于数组
- 表达式中,下标运算符 [ ] 和数组无关。p[i] 是 *(p + i) 的简便写法。
- 表达式中,数组名可以解读成“指向它的初始元素的指针”。(有三个例外,在第三章说明)。
- 有关数组名的问题,可以看这一篇博客:让你不再害怕指针——C指针详解(经典,非常详细)
二、C 是怎么使用内存的 💖
2.1 虚拟地址
- 在如今的运行环境中,应用程序面对的是虚拟地址空间。
- 操作系统和 CPU 为每一个进程分配独立的地址空间。
- 真正去保存内存数据的还是物理内存。操作系统负责将物理内存分配给虚拟地址空间,同时还会对每一个内存区域设定“只读”或者“可读写”等属性。
- 使用虚拟地址的原因:
- 一个程序存在bug,破坏了某个内存区域,只会让当前的应用程序出现问题,但不会影响其他进程。
- 避免了让应用程序直接面对物理内存的地址,操作系统能够顺利地对内存区域进行管理。
2.2 C 的内存的使用方法
- 各种东西在内存中的位置
2.3 函数和字符串常量
- 【函数(程序自身)、字符串常量】被配置在内存里相邻的地址上(一片只读的内存区域)。
- 函数指针见:《彻底搞定 C 指针》读书笔记
2.4 静态变量
- 【静态变量、全局变量】的生存期是全局的。因此,总是在虚拟地址空间上占有固定的区域。
2.5 自动变量(栈)
- PS:自动变量 == 局部变量 == 本地变量。
- 自动变量通常保存在栈中。内存区域可以被重复利用,节约内存。
- 调用函数时栈的使用情况:在现有被分配的内存区域之上,以“堆积”的方式,为新的函数调用分配内存区域。 函数返回时,会释放这部分内存区域供下一次函数调用使用。
- 下图为调用一个函数时,栈的使用情况。( 以func(1, 2)为例 )
- 补充:
- 这张图中,高地址在下,低地址在上。(注意!和常见教程不同)
- 第1步中,参数从后往前堆积的原因是:实现可变长参数的函数。
- 第7步中,由调用方将参数从栈中去除。(Java、Pascal是被调用方)
- 栈的溢出
-
如果在使用数组时,没有检查数组的长度, 将数据写入了超出数组范围的地方。
-
如果只是超过一点,可能会破坏相邻的自动变量的内容。
-
如果大范围地超过,可能会破坏内存中存储函数的返回信息的区域(这个函数不能返回了),甚至可能造成安全漏洞
-
2.6 利用 malloc()来进行动态内存分配(堆)
- malloc、free的原理(链表实现)
- 补充:
- 数组越界检查发生错误,导致越过 malloc()分配 的内存区域写入了数据,会破坏下一个块的管理区域。从此以后的 malloc()和 free()调用中出现程序崩溃的几率会非常高。
- 调用 free()之后,对应的内存内容不会被马上破坏。
- 碎片化:以随机的顺序分配、释放内存时,内存被零碎地分割,会出现很多细碎的空块(无法被利用)。
- 可以配合这个视频理解:大厂面试笔试题52丨 malloc 分配内存的原理
三、解读C的声明
3.1 解读C的声明的方法(按顺序)
- 首先,看标识符(变量名或者函数名)
- 再看,用于将标识符包起来的括弧
- 再看,用于表示数组的 [],用于表示函数的 ()
- 再看,用于表示指针的 *
- 最后,追加数据类型修饰符(在左边,int、double 等)
- 示例:
- int (*func_table[10])(int a);
- 首先,看标识符:func_table
- 再看(* [])
- 先看[],func_table是个数组(10个元素)
- 再看*,数组的元素是指针
- 再看(),指针指向函数(参数为int)
- 最后,看int,函数返回类型为int
- 综上所述,声明:func_table是10个元素的数组。元素是函数指针(参数int,返回值int)