目录
特别声明:
1. 本文共分为上下两集完成,1 ~ 4 章为上集,5 ~ 9 章为下集;
2. 本节内容为上集,下集内容请阅读:让你不再害怕指针(下集)。
前言:复杂类型说明
要彻底理解指针,就要了解复杂类型,一个复杂类型里会出现很多运算符,它们也像普通的表达式一样,有优先级,其优先级和运算优先级一样,在此总结了一下其原则:
从变量名处起,根据运算符优先级结合,一步一步分析.
下面让我们先从简单的类型开始慢慢分析吧:
变量类型 | 类型说明 |
int p; | 这是一个普通的整型变量 |
int *p; | 从 p 处开始, 先与 * 结合, 说明 p 是一个指针, 然后再与 int 结合, 说明指针所指向的内容的类型为 int 型. 所以 p 一个返回整型数据的指针. |
int p[3]; | 从 p 处开始, 先与 [] 结合, 说明 p 是一个数组, 然后再与 int 结合, 说明数组里的元素是整型的. 所以 p 是一个由整型数据组成的数组. |
int *p[3]; | 从 p 处开始,先与 [] 结合,因为其优先级比 * 高, 所以 p 是一个数组, 然后再与 * 结合, 说明数组里的元素是指针类型, 然后再与 int 结合, 说明指针所指向的内容的类型是整型的, 所以 p 是一个由返回整型数据的指针所组成的数组. |
int (*p)[3]; | 从 p 处开始, 先与 * 结合, 说明 p 是一个指针. 然后再与 [] 结合(与"()"这步可以忽略, 只是为了改变优先级), 说明指针所指向的内容是一个数组, 然后再与 int 结合, 说明数组里的元素是整型的. 所以 p 是一个指向由整型数据组成的数组的指针. |
int **p; | 从 p 开始,先与 * 结合,说明 p 是一个指针,然后再与 * 结合,说明指针所指向的元素是指针, 然后再与 int 结合,说明该指针所指向的元素是整型数据. |
int p(int); | 从 p 处起, 先与 () 结合, 说明 p 是一个函数, 然后进入 () 里分析, 说明该函数有一个整型变量的参数, 然后再与外面的 int 结合, 说明函数的返回值是一个整型数据. |
int (*p)(int); | 从 p 处开始, 先与 * 结合, 说明 p 是一个指针, 然后与 () 结合, 说明指针指向的是一个函数, 然后再与 () 里的 int 结合, 说明函数有一个 int 型的参数, 再与最外层的 int 结合, 说明函数的返回类型是整型, 所以 p 是一个指向有一个整型参数且返回类型为整型的函数的指针. |
int *(*p(int))[3]; | 可以先跳过, 不看这个类型, 过于复杂. |
理解这几个类型就差不多了,一般来说我们也不会用太复杂的类型,那样会大大降低程序的可读性,因此这几种类型已经足够用了。
一、详解指针
指针是一个特殊的变量,它里面存储的数值被解释成为内存里的一个地址。要搞清楚一个指针必须理解四个要素:指针的类型、指针所指向的类型、指针的值或者叫指针所指向的内存区、指针本身所占据的内存区。
例一:
(1) int *ptr;
(2) char *ptr;
(3) int **ptr;
(4) int (*ptr)[3];
(5) int *(*ptr)[4];
1.1 指针的类型
从语法的角度看,只要把指针声明语句里的指针名字去掉,剩下的部分就是这个指针的类型。这是指针本身所具有的类型。让我们看看例一中各个指针的类型:
指针 | 指针的类型 |
int *ptr; | int * |
char *ptr; | char * |
int **ptr; | int ** |
int (*ptr)[3]; | int (*)[3] |
int *(*ptr)[4]; | int *(*)[4] |
1.2 指针所指向的类型
当你通过指针来访问指针所指向的内存区时,指针所指向的类型决定了编译器把那片内存区当做什么内容来看待。
从语法上看,只须把指针声明语句中的指针名字和名字左边的指针声明符 * 去掉,剩下的就是指针所指向的类型。例如:
指针 | 指针所指向的类型 |
int *ptr; | int |
char *ptr; | char |
int **ptr; | int * |
int (*ptr)[3]; | int ()[3] |
int *(*ptr)[4]; | int *()[4] |
指针的类型(即指针本身的类型)和指针所指向的类型是两个概念。把与指针搅和在一起的 "类型" 分成 "指针的类型" 和 "指针所指向的类型" 两个概念,是精通指针的关键点之一。
1.3 指针的值——或者叫指针所指向的内存区或地址
指针的值是指针本身存储的数值,这个值将被编译器当作一个地址,而不是一个一般的数值。在 32 位系统中,所有类型的指针的值都是一个 32 位整数,因为 32 位系统中内存地址全都是 32 位长。指针所指向的内存区就是从指针的值所代表的那个内存地址开始,长度为 sizeof(指针所指向的类型) 的一片内存区。以后,我们说一个指针的值是 XX,就相当于说该指针指向了以 XX 为首地址的一片内存区域;我们说一个指针指向了某块内存区域,就相当于说该指针的值是这块内存区域的首地址。如图所示:
指针所指向的内存区和指针所指向的类型是两个完全不同的概念。在例一中,指针所指向的类型已经有了,但由于指针还未初始化,所以它所指向的内存区是不存在的,或者说是无意义的。
以后,每遇到一个指针,都应该问问:这个指针的类型是什么?指针指的类型是什么?该指针指向了哪里?(重点注意)
1.4 指针本身所占据的内存区
指针本身占了多大的内存? 只要用函数 sizeof(指针的类型) 测一下就知道了。在 32 位平台里,指针本身占据了 4 个字节的长度。
指针本身占据的内存这个概念在判断一个指针表达式(后面会解释)是否是左值时很有用。
二、指针的算术运算
指针可以加上或减去一个整数。指针的这种运算的意义和通常的数值的加减运算的意义是不一样的,以单元为单位。例如:
例二:
char a[20];
int *ptr = (int *)a; //强制类型转换并不会改变 a 的类型
ptr++;
在上例中,指针 ptr 的类型是 int *,它指向的类型是 int,它被初始化为指向整型变量 a。接下来的第 3 句中,指针 ptr 被加了 1,编译器是这样处理的:它把指针 ptr 的值加上了 sizeof(int),在 32 位程序中,是被加上了 4,因为在 32 位程序中,int 占 4 个字节。由于地址是用字节做单位的,故 ptr 所指向的地址由原来的变量 a 的地址向高地址方向增加了 4 个字节。由于 char 类型的长度是一个字节,所以原来 ptr 是指向数组 a 的第 0 号单元开始的四个字节,此时指向了数组 a 中从第 4 号单元开始的四个字节。如图所示:
我们可以用一个指针和一个循环来遍历一个数组,看例子:
例三:
int array[20] = {0};
int *ptr = array;
for (int i = 0; i < 20; i++)
{
(*ptr)++;
ptr++;
}
这个例子将整型数组中各个单元的值加 1。由于每次循环都将指针 ptr 加 1 个单元,所以每次循环都能访问数组的下一个单元。
再看例子:
例四:
char a[20] = "You_are_a_girl";
int *ptr = (int *)a;
ptr += 5;
在这个例子中,ptr 被加上了 5,编译器是这样处理的:将指针 ptr 的值加上 5 乘 sizeof(int),在 32 位系统中就是加上了 5 乘 4 = 20。由于地址的单位是字节,故现在的 ptr 所指向的地址比起加 5 后的 ptr 所指向的地址来说,向高地址方向移动了 20 个字节。因此,没加 5 前的 ptr 指向数组 a 的第 0 号单元开始的四个字节,加 5 后 ptr 已经指向了数组 a 的合法范围之外了。虽然这种情况在应用上会出问题,但在语法上却是可以的。这也体现出了指针的灵活性。
如果上例中,ptr 是被减去 5,那么处理过程大同小异,只不过 ptr 的值是被减去 5 乘 sizeof(int), 新的 ptr 指向的地址将比原来的 ptr 所指向的地址向低地址方向移动了 20 个字节。
下面再举一个例子(一个误区):
例五:
#include <stdio.h>
int main()
{
char a[20] = " You_are_a_girl";
char *p = a;
char **ptr = &p;
printf("**ptr=%c\n", **ptr);
ptr++;
printf("**ptr=%c\n", **ptr);
}
误区一、输出答案为 Y 和 o
误解:ptr 是一个 char 的二级指针,当执行 ptr++; 时,会使指针加一个 sizeof(char),所以输出如上结果,这个可能只是少部分人的结果。
误区二、输出答案为 Y 和 a
误解:ptr 指向的是一个 char *类型,当执行 ptr++; 时,会使指针加一个 sizeof(char *) (有可能会有人认为这个值为 1,那就会得到误区一的答案,这个值应该是 4,参考前面内容),即 &p+4; 那进行一次取值运算不就指向数组中的第五个元素了吗? 那输出的结果不就是数组中第五个元素了吗? 答案是否定的。
正解:ptr 的类型是 char **,指向的类型是一个 char * 类型,该指向的地址就是 p 的地址(&p),当执行 ptr++; 时,会使指针加一个sizeof(char*),即 &p+4; 那 *(&p+4) 指向哪呢,这个你去问上帝吧,或者他会告诉你在哪? 所以最后的输出会是一个随机的值,或许是一个非法操作。
总结一下:
一个指针 ptrold 加(减)一个整数 n 后, 结果是一个新的指针 ptrnew,ptrnew 的类型和 ptrold 的类型相同, ptrnew 所指向的类型和 ptrold 所指向的类型也相同。ptrnew 的值将比 ptrold 的值增加(减少)了 n 乘 sizeof(ptrold 所指向的类型) 个字节。就是说,ptrnew 所指向的内存区将比 ptrold 所指向的内存区向高(低)地址方向移动了 n 乘 sizeof(ptrold 所指向的类型) 个字节。
指针和指针进行加减:
两个指针不能进行加法运算,这是非法操作,因为进行加法后,得到的结果指向一个不知所向的地方,而且毫无意义。两个指针可以进行减法操作,但必须类型相同,一般用在数组方面。如图所示:
三、运算符 & 和 *
& 是取地址运算符,* 是间接运算符。
&a 的运算结果是一个指针,指针的类型是 a 的类型加个 *,指针所指向的类型是 a 的类型,指针所指向的地址就是 a 的地址。
*p 的运算结果就五花八门了。总之 *p 的结果是 p 所指向的目标,这个目标有这些特点:它的类型是 p 指向的类型,它所占用的地址是 p 所指向的地址。
例六:
变量声明 | int a=12; int b; int *p; int **ptr; |
p = &a; | &a 的结果是一个指针,类型是 int *,指向的类型是int,指向的地址是 a 的地址。 |
*p = 24; | *p 的结果,在这里它的类型是 int,它所占用的地址是 p 所指向的地址,显然 *p 就是变量 a。 |
ptr = &p; | &p 的结果是个指针,该指针的类型是 p 的类型加个 *,在这里是 int **。该指针所指向的类型是 p 的类型,这里是 int*。 该指针所指向的地址就是指针 p 自己的地址。 |
*ptr = &b; | *ptr 是个指针,&b 的结果也是个指针,且这两个指针的类型和所指向的类型是一样的,所以用 &b 来给 *ptr 赋值是没有问题的。 |
**ptr = 34; | *ptr 的结果是 ptr 所指向的东西,在这里是一个指针,对这个指针再做一次 * 运算,结果是一个 int 类型的变量。 |
四、指针表达式
一个表达式的结果如果是一个指针,那么这个表达式就叫指针表式。下面是一些指针表达式的例子:
例七:
int a, b;
int array[10];
int *pa;
pa = &a; // &a 是一个指针表达式。
int **ptr = &pa; // &pa 也是一个指针表达式。
*ptr = &b; // *ptr 和 &b 都是指针表达式。
pa = array;
pa++; // 这也是指针表达式。
例八:
char *arr[20];
char **parr = arr; // 如果把 arr 看作指针的话,arr 也是指针表达式
char *str;
str = *parr; // *parr 是指针表达式
str = *(parr+1); // *(parr+1) 是指针表达式
str = *(parr+2); // *(parr+2) 是指针表达式
由于指针表达式的结果是一个指针,所以指针表达式也具有指针所具有的四个要素:指针的类型, 指针所指向的类型, 指针指向的内存区,指针自身占据的内存。
当一个指针表达式的结果指针已经明确地具有了指针自身占据的内存的话,这个指针表达式就是一个左值,否则就不是一个左值。在例七中,&a 不是一个左值,因为它还没有占据明确的内存。*ptr 是一个左值,因为 *ptr 这个指针已经占据了内存,其实 *ptr 就是指针 pa,既然 pa 已经在内存中有了自己的位置,那么 *ptr 当然也有了自己的位置(可参考例六示图)。