C指针深度解析

1)指针的概念

指针是一种数据类型,而内存地址是这种数据类型具体的值(注意区分两者的概念)。先说一下什么是内存地址:假设CPU的寻址方式是以字节寻址的,即每一个字节对应一个地址编号(则机器字长、存储字长和数据字长都是字节的整数倍,所有的数据类型占据的空间大小都是字节的整数倍)。对于32位操作系统,地址码最长可达32位,则可以寻址的最大数目为:2^{32}=4G,由于最小单位是字节,因此可寻址的最大内存为4GB。64位操作系统,则为2^{64}B。因此,在32位操作系统中,地址(指针值)是一个32位的二进制数:0~2^{32}-1,因此指针变量(地址值)在32位操作系统中占据的空间大小为4bytes(32位),由于地址值用32位二进制数表示不方便,因此用8位16进制数表示(0x00000000~0xFFFFFFFF)。指针变量跟其余任何变量一样,都是一个值,且都要占据地址空间。指针是指本身的地址值,与指针的地址不同(两者不一定相等)。指针:计算机内一块内存来存放另一块内存的地址(注意是首地址)。所以,对一个指针取地址,无非就是对一块内存取地址,跟对一个整数取地址,对一个浮点数取地址,对一个数组取地址,对一个函数取地址,没有任何区别:char c[5]="abc"; // 内存c的地址是:&c    void f(int size, float length); // 内存f的地址是:&f    int *p = &a; // 内存p的地址是:&p  一般情况下:字节占据1个字节,int为4个字节,指针跟操作系统位数相关。

int *p1; int **p2; int (*p3)[5];   int (**p4)[5];   int (*p5)[5][5];  p1~p5都是指针,p1为一级指针;p2为二重指针(二级指针或指针的指针),即p2所指的地址的内容依然是地址,而该地址所指的地址的内容为int类型;p3为指针,其类型为int (*)[5],所指地址存储的内容为整型数组(5个元素);p4为二级指针,其最终存储的内容为整型数组(5个元素);p5为指针,其类型为int (*)[5][5],所指地址存储的内容为整型二维数组(25个元素)。

指针的步长。每个指针都是有步长的,这与指针的计算有着密切关系。指针的步长就是指针(地址)所指的内容的大小(占据的字节数)。如 int *p,则p的步长为4bytes,p+1则是p地址的基础上移动4个bytes。int (*p3)[5]; p3的步长就是20bytes。

*[ ]对指针的作用。*(p+i)是取出指针p+i所指向的内容,如*p1是取出的整形数值int;*p3是取出的整个一维数组(5个元素)。int a[6][7]; *a取出的是a[0]这个一维数组;*(a+1)取出的是a[1]这个一维数组;*a[0]取出的是a[0][0]。*(p+i)=p[i],两者作用一样,即p[i]则是指将指针p移动i个步长后所指向的内容。

二级指针步长分析(二级指针的内存分布)。例如:int **p; p是一个地址,由于p地址的内容依然是地址,因此p指针的步长为指针的字节数(8个字节,以32位为例)。因此所有二级指针的步长都是一样的,都是8bytes。而*p依然是指针,即存储的内容为int数值,因此*p的步长为4bytes。因此,当用二级指针p来表示一个二维数组时,其每一个元素(int)在内存中的分布并不向二维数组int a[i][j]那样都是连续的,它们的分布不一样的。*p表示二维数组中的每一个元素a[i](一维数组)的首地址,而p则是将所有*p作为一维数组的首地址。因此,在用指针p表示二维数组时,只有二维数组中的每一个元素(一位数组)内部分布是连续的,至于元素与元素之间的分布不一定是连续的,取决于*p与*(p+1)的值。综上,二级指针p与二维数组a之间不能相互传递参数,因为它们在内存中的分布是不一样的,否则会引发段错误(SIGSEGV)。如果p=a;则p的步长为8bytes,则*p或p[0]就会把数组a的前两个元素a[0][0]和a[0][1]合并在一起8个字节当成一个地址,紧接着*(*p)或p[0][0]就是前一个地址所指向的前4个bytes的内容,但是*p这个地址是用户未定义的,因此属于非法访问内存,因此会引发段错误。所以,一定要注意,两者之间不能直接传递参数。可以将二维数组重新用二级指针表示(后面会介绍方法),然后就可以用二级指针p来访问二维数组了,其访问方法为:p[i][j]或*(*(p+i)+j),即:先将指针p移动i个步长取出地址值,然后再移动j个步长的地址的内容就是p[i][j]元素,对应的就是a[i][j]。

对于一维数组int a[10];与int *p;p与a之间可以直接传递,因为内存分布一样,具体分析同前面。p=a,则*(p+i)=p[i]=a[i]。对于char *argv[10]; char **p;  p与argv之间也可以直接传递数据,因为两者内存分布一样:*(p+i)=p[i]=argv[i],都是char *类型的指针,它们存储的内容都是char,步长都为1bytes,因此都可以表示一个字符串,所以在命令行参数和环境变量中可以使用char **p二级指针来传递形参。

二维数组int b[i][j];用二级指针int **p;来表示:int *a[i];a[i]=b[i];p=a;则有:*(p+i)=p[i]=a[i],*(*(p+i)+j)=p[i][j]=a[i][j]=b[i][j]。因此,b与p之间要传递参数时,可以用a来搭桥。

2)指针与数组的关系举例分析

探究数组名与指针的关系:将a[3][5]全部元素初始化为0

//ex1.c

#include <stdio.h>

int main(void)
{
        int a[10]={0};
        int *p;
        p=a;
        printf("a[1]=%d, &p=%#x, p=%#x\n",p[1],&p,p);
        return 0;
}
[root@localhost 01_pthread_test]# ./ex1
a[1]=0, &p=0xff875cc4, p=0xff875cc8

//ex.c

#include <stdio.h>

int main(void)
{
        int **p;
        int a[3][5]={0};

        p=a;
        printf("&a=%#x, a=%#x, a[0]=%#x, *a=%#x, a+1=%#x, a[0]+1=%#x, a[1]=%#x, &a[0][0]=%#x\n",&a, a,a[0],*a,a+1,a[0]+1,a[1],&a[0][0]);
        printf("*(&a[0][0])=%#x\n",*(&a[0][0]));
        printf("*(*a)=%#x\n",*(*a));
        printf("a=%#x\n",a);
        printf("&p=%#x, p=%#x, *p=%#x\n",&p,p,*p); 
        printf("*(*p)=%d\n",*(*p));   //该句出现段错误
        return 0;
}
[root@localhost 01_pthread_test]# ./ex
&a=0xff83a4d0, a=0xff83a4d0, a[0]=0xff83a4d0, *a=0xff83a4d0, a+1=0xff83a4e4, a[0]+1=0xff83a4d4, a[1]=0xff83a4e4, &a[0][0]=0xff83a4d0
*(&a[0][0])=0
*(*a)=0
a=0xff83a4d0
&p=0xff83a50c, p=0xff83a4d0, *p=0
Segmentation fault (core dumped)

//ex2.c(二维数组用二级指针的另一种表示方法)

#include <stdio.h>
#include <stdlib.h>
#include <stddef.h>

int main(void)
{
        int **p;
        int i, j;

        p=(int **)malloc( sizeof(int *)*3 );
        for(i=0;i<3;i++)
        {
            p[i]=(int *)malloc( sizeof(int)*5 );
        }

        for(i=0;i<3;i++)
            for(j=0;j<5;j++)
            {
                p[i][j]=3;
            }

        printf("p[2][3]=%d\n",p[2][3]);

        return 0;
}
[root@localhost 01_pthread_test]# ./ex2
p[2][3]=3

分析:

强调一点:数组名、函数名等类似的东西都不是指针!!!只是在使用的时候它们被隐式转换为了指针。一维数组:int a[10]; sizeof(a)中,a就没有转换为指针,a指的就是数组本身 ,sizeof(a)的结果为40(40bytes)。如果对a的操作中涉及元素的操作时,由于仅仅指出a系统并不清楚要具体取哪一个元素,因此直接返回给数组的首地址,即a被隐式转换为数组的第一个元素的地址&a[0]。二维数组:int a[10][9]; 其本质就是一个一维数组(数组的数组),在内存中的分布是一维的,一行紧接着一行连续分布:即a[0][8]的后面紧接着就是a[1][0]。a[10][9]可以看成是a[0]、a[1]、······、a[9]这十个元素构成的数组,其中a[0]是二维数组的首元素;而a[0]、a[1]、······、a[9]这十个元素中每一个元素又是一个数组(类型为int [9]),即a[0]代表:a[0][0]~a[0][8]。因此在隐式转换时:a被隐式转换为二维数组第一个元素的首地址,即a=&a[0],a的步长为36bytes,指向的是a[0]这个数组(这一行);而a[0]如果进行隐式转换,则转换为a[0]这个一维数组的首地址,即&a[0][0]。注意,a与a[0]隐式转换后值是相等的,但是步长不一样,a[0]转换后,所指向的内容是a[0][0],即int类型,因此步长为4bytes。因此a与a[0]的指针值虽然是相等的,但是步长不一样,即:a+1与a[0]+1不相等。a+1指向的是a[1][0],a[0]+1指向的是a[0][1]。

在上面程序ex.c中。p&a、a、a[0]、*a、a+1、a[0]+1、a[1]、&a[0][0]、*(&a[0][0])、*(*a)。p是一个二级指针,最终地址内容为int型数值;&a为int (*)[3][5]类型,即指向整个二维数组;a是整个数组,隐式转换为指向a[0]的指针,int (*)[5]类型;a[0]是一维数组,隐式转换为指向a[0][0]的指针,int *类型;*a经历了两次隐式转换,第一次a被转换,第二次*a被转换,最终为指向a[0][0]的指针,为int *类型;a+1,int (*)[5]类型;a[0]+1,int *类型;a[1],int *类型;&a[0][0],int *类型。根据上面程序输出结果可以判断。若p=a,则&p,int ***类型;p,int **类型;*p为int*内容;此时程序可以输出结果(不会发生错误),但是结果毫无意义。*(*p)则会发生段错误,因此*p地址的内容用户未定义,非法访问内存。

程序ex2.c描述了另一种方法将二级指针表示二维数组。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值