目录
指针基础
指针是一个特殊的变量,它里面存储的数值被解释成为内存里的一个地址。 要搞清一个指针需要搞清指针的四方面的内容:
- 指针的类型
- 指针所指向的 类型
- 指针的值或者叫指针所指向的内存区
- 指针本身所占据的内存区
1.指针的类型
从语法的角度看,只要把指针声明语句里的指针名字去掉,剩下的部 分就是这个指针的类型。这是指针本身所具有的类型。让我们看看例一中各 个指针的类型:
int*ptr;//指针的类型是 int*
char*ptr;//指针的类型是 char*
int**ptr;//指针的类型是 int**
int(*ptr)[3];//指针的类型是 int(*)[3]
int*(*ptr)[4];//指针的类型是 int*(*)[4]
2.指针所指向的类型
当你通过指针来访问指针所指向的内存区时,指针所指向的类型决定了 编译器将把那片内存区里的内容当做什么来看待。
从语法上看,你只须把指针声明语句中的指针名字和名字左边的指针声 明符*去掉,剩下的就是指针所指向的类型。例如:
int*ptr; //指针所指向的类型是 int
char*ptr; //指针所指向的的类型是 char
int**ptr; //指针所指向的的类型是 int*
int(*ptr)[3]; //指针所指向的的类型是 int()[3]
int*(*ptr)[4]; //指针所指向的的类型是 int*()[4
在指针的算术运算中,指针所指向的类型有很大的作用。 指针的类型(即指针本身的类型)和指针所指向的类型是两个概念。
3.指针的值——指针所指向的内存区或地址
指针的值是指针本身存储的数值,这个值将被编译器当作一个地址,而 不是一个一般的数值。在 32 位程序里,所有类型的指针的值都是一个 32 位 整数,因为 32 位程序里内存地址全都是 32 位长。 指针所指向的内存区就 是从指针的值所代表的那个内存地址开始,长度为 sizeof(指针所指向的类 型)的一片内存区。以后,我们说一个指针的值是 XX,就相当于说该指针指 向了以 XX 为首地址的一片内存区域;我们说一个指针指向了某块内存区域, 就相当于说该指针的值是这块内存区域的首地址。
指针所指向的内存区和指针所指向的类型是两个完全不同的概念。在上面的指针的类型中,指针所指向的类型已经有了,但由于指针还未初始化,所以它所指向 的内存区是不存在的,或者说是无意义的。
4.指针本身占据的内存区
指针本身占用的内存大小只要用函数 sizeof(指针的类型)测一下就知道了。在 32 位平台里,指针本身占据了 4 个字节的长度。 指针本身占据的内存这个概念在判断一个指针表达式是否是左值时很有用 。
注:
左值(lvalue)是一个表达式,它指向一个可存储值的内存位置。简单来说,左值是可以被赋值的、可以取地址的表达式。
在C和C++中,左值可以是变量、数组元素、结构的成员或者一个指向这些的指针。例如,一个整数变量 x 是一个左值,因为它表示一个可以存储值的内存位置。
在赋值操作中,左值出现在等号的左边,右值出现在等号的右边。例如,x = 5
中的 x
是左值,而 5
是右值。
左值还可以取地址,即获取它在内存中的位置。这对于使用指针来引用变量或进行内存操作非常有用。
总结来说,左值是一个表示可存储值的内存位置的表达式,可以被赋值和取地址。与之相对的是右值,它表示一个临时的值,不能被赋值或取地址。
指针的算数运算
指针可以加上或减去一个整数。指针的这种运算的意义和通常的数值的加减 运算的意义是不一样的,以单元为单位。例如:
char a[20];
int *ptr=(int *)a; //强制类型转换并不会改变 a 的类型
ptr++;
在上例中,指针 ptr 的类型是 int*,它指向的类型是 int,它被初始化 为指向整型变量 a。接下来的第 3 句中,指针 ptr 被加了 1,编译器是这样 处理的:它把指针 ptr 的值加上了 sizeof(int),在 32 位程序中,是被加上 了 4,因为在 32 位程序中,int 占 4 个字节。由于地址是用字节做单位的, 故 ptr 所指向的地址由原来的变量 a 的地址向高地址方向增加了 4 个字节。 由于 char 类型的长度是一个字节,所以,原来 ptr 是指向数组 a 的第 0 号 单元开始的四个字节,此时指向了数组 a 中从第 4 号单元开始的四个字节。
我们可以用一个指针和一个循环来遍历一个数组:
int array[20]={0};
int *ptr=array;
for(i=0;i<20;i++)
{
(*ptr)++;
ptr++;
}
这个例子将整型数组中各个单元的值加 1。由于每次循环都将指针 ptr 加 1 个单元,所以每次循环都能访问数组的下一个单元。
char a[20]="You_are_a_girl";
int *ptr=(int *)a;
ptr+=5;
在这个例子中,ptr 被加上了 5,编译器是这样处理的:将指针 ptr 的 值加上 5 乘 sizeof(int),在 32 位程序中就是加上了 5 乘 4=20。由于地址 的单位是字节,故现在的 ptr 所指向的地址比起加 5 后的 ptr 所指向的地址来说,向高地址方向移动了 20 个字节。在这个例子中,没加 5 前的 ptr 指 向数组 a 的第 0 号单元开始的四个字节,加 5 后,ptr 已经指向了数组 a 的 合法范围之外了。虽然这种情况在应用上会出问题,但在语法上却是可以的。 这也体现出了指针的灵活性。
再举一个例子:(一个误区):
#include<stdio.h>
int main()
{
char a[20]=" You_are_a_girl";
char *p=a;
char **ptr=&p;
//printf("p=%d\n",p);
//printf("ptr=%d\n",ptr);
//printf("*ptr=%d\n",*ptr);
printf("**ptr=%c\n",**ptr);
ptr++;
//printf("ptr=%d\n",ptr);
//printf("*ptr=%d\n",*ptr);
printf("**ptr=%c\n",**ptr);
}
- 误区一、输出答案为 Y 和 o
误解:ptr 是一个 char 的二级指针,当执行 ptr++;时,会使指针加一个 sizeof(char),所以输出如上结果,这个可能只是少部分人的结果.
- 误区二、输出答案为 Y 和 a
误解:ptr 指向的是一个 char *类型,当执行 ptr++;时,会使指针加一个 sizeof(char *)(有可能会有人认为这个值为 1,那就会得到误区一的答 案,这个值应该是 4,参考前面内容), 即&p+4; 那进行一次取值运算不 就指向数组中的第五个元素了吗?那输出的结果不就是数组中第五个元 素了吗?答案是否定的.
- 正解:
ptr 的类型是 char **,指向的类型是一个 char *类型,该指向的 地址就是p的地址(&p),当执行ptr++;时,会使指针加一个sizeof(char *),即&p+4;那*(&p+4)指向哪呢,无从知晓。所以最后的输出会是一个随机的值,或许是一个非法操作.。
总结:
一个指针 ptrold 加(减)一个整数 n 后,结果是一个新的指针 ptrnew, ptrnew 的类型和 ptrold 的类型相同,ptrnew 所指向的类型和 ptrold 所指向的类型也相同。ptrnew 的值将比 ptrold 的值增加(减少)了 n 乘 sizeof(ptrold 所指向的类型)个字节。就是说,ptrnew 所指向的内存 区将比 ptrold 所指向的内存区向高(低)地址方向移动了 n 乘 sizeof(ptrold 所指向的类型)个字节。
指针和指针进行加减:
两个指针不能进行加法运算,这是非法操作,因为进行加法后,得到的 结果指向一个不知所向的地方,而且毫无意义。两个指针可以进行减法 操作,但必须类型相同,一般用在数组方面。
运算符&和*
这里&是取地址运算符,*是间接运算符。
&a 的运算结果是一个指针,指针的类型是 a 的类型加个*,指针所 指向的类型是 a 的类型,指针所指向的地址是 a 的地址。 *p 的运算结果五花八门,总之*p 的结果是 p 所指向的东西, 这个东西有这些特点:它的类型是 p 指向的类型,它所占用的地址是 p 所指向的地址。
int a=12; int b; int *p; int **ptr;
p=&a; //&a 的结果是一个指针,类型是 int*,指向的类型是int,指向的地址是 a 的地址。
*p=24; //*p 的结果,在这里它的类型是 int,它所占用的地址是p 所指向的地址,显然,*p 就是变量 a。
ptr=&p; //&p 的结果是个指针,该指针的类型是 p 的类型加个*,
//在这里是 int **。该指针所指向的类型是 p 的类型
//这里是 int*。该指针所指向的地址就是指针 p 自己的地址。
*ptr=&b; //*ptr 是个指针,&b 的结果也是个指针,且这两个指针
//的类型和所指向的类型是一样的,所以用&b 来给*ptr 赋值就是毫无问题的了。
**ptr=34; //*ptr 的结果是 ptr 所指向的东西,在这里是一个指针,对这个指针再做一次*运算
//结果是一个int类型的变量。
指针表达式
一个表达式的结果如果是一个指针,那么这个表达式就叫指针表式。
示例1:
int a,b;
int array[10];
int *pa;
pa=&a; //&a 是一个指针表达式。
Int **ptr=&pa; //&pa 也是一个指针表达式。
*ptr=&b; //*ptr 和&b 都是指针表达式。
pa=array;
pa++; //这也是指针表达式。
示例2:
char *arr[20];
char **parr=arr; //如果把 arr 看作指针的话,arr 也是指针表达式
char *str;
str=*parr; //*parr 是指针表达式
str=*(parr+1); //*(parr+1)是指针表达式
str=*(parr+2); //*(parr+2)是指针表达式
由于指针表达式的结果是一个指针,所以指针表达式也具有指针所 具有的四个要素:指针的类型,指针所指向的类型,指针指向的内存区, 指针自身占据的内存。
当一个指针表达式的结果指针已经明确地具有了指针自身占据的内存的话,这个指针表达式就是一个左值,否则就不是一个左值。 在示例1中,&a 不是一个左值,因为它还没有占据明确的内存。*ptr 是 一个左值,因为*ptr 这个指针已经占据了内存,其实*ptr 就是指针 pa, 既然 pa 已经在内存中有了自己的位置,那么*ptr 当然也有了自己的位 置。
数组和指针的关系
数组的数组名其实可以看作一个指针。
intarray[10]={0,1,2,3,4,5,6,7,8,9},value;
value=array[0]; //也可写成:value=*array;
value=array[3]; //也可写成:value=*(array+3);
value=array[4]; //也可写成:value=*(array+4);
上例中,一般而言数组名 array 代表数组本身,类型是 int[10],但如 果把 array 看做指针的话,它指向数组的第 0 个单元,类型是 int* , 所指向的类型是数组单元的类型即 int。因此*array 等于 0 就一点也不 奇怪了。同理,array+3 是一个指向数组第 3 个单元的指针,所以 *(array+3)等于 3。其它依此类推
char *str[3]={
"Hello,thisisasample!",
"Hi,goodmorning.",
"Helloworld"
};
chars[80];
strcpy(s,str[0]); //也可写成 strcpy(s,*str);
strcpy(s,str[1]); //也可写成 strcpy(s,*(str+1));
strcpy(s,str[2]); //也可写成 strcpy(s,*(str+2));
。上例中,str 是一个三单元的数组,该数组的每个单元都是一个指针, 这些指针各指向一个字符串。把指针数组名 str 当作一个指针的话,它 指向数组的第 0 号单元,它的类型是 char **,它指向的类型是 char *。
*str 也是一个指针,它的类型是 char *,它所指向的类型是 char,它 指向的地址是字符串"Hello,thisisasample!"的第一个字符的地址,即 'H'的地址。注意:字符串相当于是一个数组,在内存中以数组的形式储 存,只不过字符串是一个数组常量,内容不可改变,且只能是右值.如果 看成指针的话,他即是常量指针,也是指针常量.
str+1 也是一个指针,它指向数组的第 1 号单元,它的类型是 char**, 它指向的类型是 char。
(str+1)也是一个指针,它的类型是 char*,它所指向的类型是 char, 它指向 "Hi,goodmorning."的第一个字符'H'
总结:
声明了一个数组 TYPE array[n],则数组名称 array 就有了两重含义: 第一,它代表整个数组,它的类型是 TYPE[n];第二 ,它是一个常量 指针,该指针的类型是 TYPE*,该指针指向的类型是 TYPE,也就是数组 单元的类型,该指针指向的内存区就是数组第 0 号单元,该指针自己占 有单独的内存区,注意它和数组第 0 号单元占据的内存区是不同的。该 指针的值是不能修改的,即类似 array++的表达式是错误的。
在不同的表达式中数组名 array 可以扮演不同的角色。
在表达式 sizeof(array)中,数组名 array 代表数组本身,故这时 sizeof 函数测出的是整个数组的大小。
在表达式*array 中,array 扮演的是指针,因此这个表达式的结果就是 数组第 0 号单元的值。sizeof(*array)测出的是数组单元的大小。 表达式 array+n(其中 n=0,1,2,.....)中,array 扮演的是指 针,故 array+n 的结果是一个指针,它的类型是 TYPE *,它指向的类 型是 TYPE,它指向数组第 n 号单元。故 sizeof(array+n)测出的是指针 类型的大小。在 32 位程序中结果是 4
指针和结构类型的关系
可以声明一个指向结构类型对象的指针。
struct MyStruct
{
int a;
int b;
int c;
};
struct MyStruct ss={20,30,40};//声明了结构对象 ss,并把 ss 的成员初始化为 20,30 和 40。
struct MyStruct *ptr=&ss;//声明了一个指向结构对象 ss 的指针。它的类型是
//MyStruct *,它指向的类型是 MyStruct。
int *pstr=(int*)&ss;//声明了一个指向结构对象 ss 的指针。但是 pstr 和
//它被指向的类型 ptr 是不同的。
请问怎样通过指针 ptr 来访问 ss 的三个成员变量?
答案:
ptr->a; //指向运算符,或者可以这们(*ptr).a,建议使用前者
ptr->b;
ptr->c;
又请问怎样通过指针 pstr 来访问 ss 的三个成员变量?
答案:
*pstr; //访问了 ss 的成员 a。
*(pstr+1); //访问了 ss 的成员 b。
*(pstr+2) //访问了 ss 的成员 c。
所有的 C/C++编译器在排列数组的单元时,总是把各个数组单元存 放在连续的存储区里,单元和单元之间没有空隙。但在存放结构对象的 各个成员时,在某种编译环境下,可能会需要字对齐或双字对齐或者是 别的什么对齐,需要在相邻两个成员之间加若干个"填充字节",这就导 致各个成员之间可能会有若干个字节的空隙。
指针和函数的关系
可以把一个指针声明成为一个指向函数的指针。
int fun(char *);
inta;
char str[]="abcdefghijklmn";
a=fun(str);
int fun(char *s)
{
int num=0;
for(int i=0;;)
{
num+=*s;s++;
}
return num;
}
这个例子中的函数fun统计一个字符串中各个字符的ASCII码值之 和。前面说了,数组的名字也是一个指针。在函数调用中,当把 str 作为实参传递给形参 s 后,实际是把 str 的值传递给了 s,s 所指向的 地址就和 str 所指向的地址一致,但是 str 和 s 各自占用各自的存储空 间。在函数体内对 s 进行自加 1 运算,并不意味着同时对 str 进行了自 加 1 运算。
指针类型转换
当我们初始化一个指针或给一个指针赋值时,赋值号的左边是一个指 针,赋值号的右边是一个指针表达式。在我们前面所举的例子中,绝大多数情况下,指针的类型和指针表达式的类型是一样的,指针所指向的类型和指针表达式所指向的类型是一样的。
float f=12.3;
float *fptr=&f;
int *p;
在上面的例子中,假如我们想让指针 p 指向实数 f,应该怎么办? 是用下面的语句吗?
p=&f;
不对。因为指针 p 的类型是 int *,它指向的类型是 int。表达式 &f 的结果是一个指针,指针的类型是 float *,它指向的类型是 float。 两者不一致,直接赋值的方法是不行的。对指针的赋值语句要求赋值号两边的类型一致,所指向的类型也一致。为了实现我们的目的,需要进 行"强制类型转换":
p=(int*)&f;
如果有一个指针 p,我们需要把它的类型和所指向的类型改为 TYEP *TYPE, 那么语法格式是: (TYPE *)p;
这样强制类型转换的结果是一个新指针,该新指针的类型是 TYPE *,它指向的类型是 TYPE,它指向的地址就是原指针指向的地址。 而原来的指针 p 的一切属性都没有被修改。(切记)
一个函数如果使用了指针作为形参,那么在函数调用语句的实参和 形参的结合过程中,必须保证类型一致 ,否则需要强制转换
unsigned int a;
TYPE *ptr; //TYPE 是 int,char 或结构类型等等类型。
a=20345686;
ptr=20345686; //我们的目的是要使指针 ptr 指向地址 20345686
ptr=a; //我们的目的是要使指针 ptr 指向地址 20345686
编译一下,结果发现后面两条语句全是错的 。
unsigned int a;
TYPE *ptr; //TYPE 是 int,char 或结构类型等等类型。
a=N //N 必须代表一个合法的地址;
ptr=(TYPE*)a; //这就可以了。
严格说来这里的(TYPE *)和指针类型转换中的(TYPE *)还不一样。这里 的(TYPE*)的意思是把无符号整数 a 的值当作一个地址来看待。上面强 调了 a 的值必须代表一个合法的地址,否则的话,在你使用 ptr 的时候, 就会出现非法操作错误。
指针的安全问题
char s='a';
int *ptr;
ptr=(int *)&s;
*ptr=1298;
指针 ptr 是一个 int *类型的指针,它指向的类型是 int。它指向 的地址就是 s 的首地址。在 32 位程序中,s 占一个字节,int 类型占四 个字节。最后一条语句不但改变了 s 所占的一个字节,还把和 s 相临的 高地址方向的三个字节也改变了。这三个字节是干什么的?只有编译程序知道,而写程序的人是不太可能知道的。也许这三个字节里存储了非常重要的数据,也许这三个字节里正好是程序的一条代码,而由于对指针的马虎应用,这三个字节的值被改变了!这会造成崩溃性的错误。
char a;
int *ptr=&a;
ptr++;
*ptr=115;
该例子完全可以通过编译,并能执行。但是第 3 句对指 针 ptr 进行自加 1 运算后,ptr 指向了和整形变量 a 相邻的高地址方向 的一块存储区。这块存储区里是什么?我们不知道。有可能它是一个非常重要的数据,甚至可能是一条代码。而第 4 句竟然往这片存储区里写 入一个数据!这是严重的错误。所以在使用指针时必须非常清楚:指针究竟指向了哪里。在用指针访问数组的时候,也要注意不要超出数组的低端和高端界限,否则也会造成类似的错误。
在指针的强制类型转换:ptr1=(TYPE *)ptr2 中,如果 sizeof(ptr2 的类型)大于 sizeof(ptr1 的类型),那么在使用指针 ptr1 来访问 ptr2 所指向的存储区时是安全的 。 如果 sizeof(ptr2 的 类 型 ) 小 于 sizeof(ptr1 的类型),那么在使用指针 ptr1 来访问 ptr2 所指向的存 储区时是不安全的。