C语言指针(1)嵌入式linux

计算机中所有的数据都必须放在内存中,不同类型的数据占用的字节数不一样,例如 int占用4个字节,char 占用1个字节。为了正确地访问这些数据,必须为每个字节都编上号码,就像门牌号、身份证号一样,每个字节的编号是唯一的,根据编号可以准确地找到某个字节。

 我们将内存中字节的编号称为地址(Address)或指针(Pointer。地址从 0 开始依次增加,对于 32 位环境,程序能够使用的内存为 4GB,最小的地址为 0,最大的地址为 0XFFFFFFFF

 

#include <stdio.h>

int main()

{

    int a = 100;

    char str[20] ="hello";

    printf("%#X, %#X\n",&a, str);

    return 0;

}

 

运行结果:

0X28FF3C, 0X28FF10

 

%#X表示以十六进制形式输出,并附带前缀0Xa是一个变量,用来存放整数,需要在前面加&来获得它的地址;str本身就表示字符串的首地址,不需要加&

C语言用变量来存储数据,用函数来定义一段可以重复使用的代码,它们最终都要放到内存中才能供 CPU 使用。

 

数据和代码都以二进制的形式存储在内存中,计算机无法从格式上区分某块内存到底存储的是数据还是代码。当程序被加载到内存后,操作系统会给不同的内存块指定不同的权限,拥有读取和执行权限的内存块就是代码,而拥有读取和写入权限(也可能只有读取权限)的内存块就是数据。CPU只能通过地址来取得内存中的代码和数据,程序在执行过程中会告知 CPU 要执行的代码以及要读写的数据的地址。如果程序不小心出错,或者开发者有意为之,在 CPU 要写入数据时给它一个代码区域的地址,就会发生内存访问错误。这种内存访问错误会被硬件和操作系统拦截,强制程序崩溃,程序员没有挽救的机会。CPU访问内存时需要的是地址,而不是变量名和函数名!变量名和函数名只是地址的一种助记符,当源文件被编译和链接成可执行程序后,它们都会被替换成地址。编译和链接过程的一项重要任务就是找到这些名称所对应的地址。假设变量 a、b、c 在内存中的地址分别是 0X1000、0X2000、0X3000,那么加法运算c = a + b;将会被转换成类似下面的形式:

 0X3000 = (0X1000) + (0X2000);

( )表示取值操作,整个表达式的意思是,取出地址 0X1000 和 0X2000 上的值,将它们相加,把相加的结果赋值给地址为 0X3000 的内存变量名和函数名为我们提供了方便,让我们在编写代码的过程中可以使用易于阅读和理解的英文字符串,不用直接面对二进制地址,那场景简直让人崩溃。需要注意的是,虽然变量名、函数名、字符串名和数组名在本质上是一样的,它们都是地址的助记符,但在编写代码的过程中,我们认为变量名表示的是数据本身,而函数名、字符串名和数组名表示的是代码块或数据块的首地址。数据在内存中的地址也称为指针,如果一个变量存储了一份数据的指针,我们就称它为指针变量。在C语言中,允许用一个变量来存放指针,这种变量称为指针变量。指针变量的值就是某份数据的地址,这样的一份数据可以是数组、字符串、函数,也可以是另外的一个普通变量或指针变量。现在假设有一个 char 类型的变量 c,它存储了字符 'K'(ASCII码为十进制数 75),并占用了地址为 0X11A 的内存(地址通常用十六进制表示)。另外有一个指针变量 p,它的值为 0X11A,正好等于变量 c 的地址,这种情况我们就称 p 指向了 c,或者说 p 是指向变量 c 的指针。

                               

定义指针变量与定义普通变量非常类似,不过要在变量名前面加星号*,格式为:

数据类型 *变量名;      

数据类型 *变量名 = 值 ;

*表示这是一个指针变量,数据类型表示该指针变量所指向的数据的类型 。例如:

int *p1;

p1 是一个指向 int 类型数据的指针变量,至于 p1 究竟指向哪一份数据,应该由赋予它的值决定。再如:

int a = 100;

int *p_a = &a;

在定义指针变量 p_a 的同时对它进行初始化,并将变量 a 的地址赋予它,此时 p_a 就指向了 a。值得注意的是,p_a 需要的是一个地址,a 前面必须要加取地址符&,否则是不对的。

 

和普通变量一样,指针变量也可以被多次写入,只要你想,随时都能够改变指针变量的值,请看下面的代码:

//定义普通变量

float a = 99.5, b = 10.6;

char c = '@', d = '#';

//定义指针变量

float *p1 = &a;

char *p2 = &c;

//修改指针变量的值

p1 = &b;

p2 = &d;

*是一个特殊符号,表明一个变量是指针变量,定义 p1、p2 时必须带*。而给 p1、p2 赋值时,因为已经知道了它是一个指针变量,就没必要多此一举再带上*,后边可以像使用普通变量一样来使用指针变量。也就是说,定义指针变量时必须带*,给指针变量赋值时不能带*

假设变量 a、b、c、d 的地址分别为0X1000、0X1004、0X2000、0X2004,下面的示意图很好地反映了 p1、p2 指向的变化:

 需要强调的是,p1、p2 的类型分别是float*和char*,而不是float和char,它们是完全不同的数据类型,要引起注意。

指针变量存储了数据的地址,通过指针变量能够获得该地址上的数据,格式为:

*pointer;

这里的*称为指针运算符,用来取得某个地址上的数据,请看下面的例子:

#include <stdio.h>

int main()

{

    int a = 15;

    int *p = &a;

    printf("%d, %d\n", a,*p);  //两种方式都可以输出a的值

    return 0;

}

运行结果:

15, 15

*p 代表的是 a 中的数据,它等价于 a,可以将另外的一份数据赋值给它,也可以将它赋值给另外的一个变量。

*在不同的场景下有不同的作用:*可以用在指针变量的定义中,表明这是一个指针变量,以和普通变量区分开;使用指针变量时在前面加*表示获取指针指向的数据,或者说表示的是指针指向的数据本身。

也就是说,定义指针变量时的*和使用指针变量时的*意义完全不同。以下面的语句为例:

int *p = &a;

*p = 100;

第1行代码中*用来指明 p是一个指针变量,第2行代码中*用来获取指针指向的数据。

需要注意的是,给指针变量本身赋值时不能加*。修改上面的语句:

int *p;

p = &a;

*p = 100;

第2行代码中的 p前面就不能加*。

 

指针变量也可以出现在普通变量能出现的任何表达式中,例如:

int x = 10;

int y = 20;

int *px = &x;

int *py = &y;

y = *px + 5;   //表示把x的内容加5并赋给y,*px+5相当于(*px)+5

y = ++*px;    //px的内容加上1之后赋给y,++*px相当于++(*px)

y = *px++;    //相当于y=*(px++)

py = px;        //把一个指针的值赋给另一个指针

指针变量保存的是地址,本质上是一个整数,可以进行部分运算,例如加法、减法、比较等,请看下面的代码:

#include <stdio.h>

int main()

{

    int    a = 10,  *pa = &a, *paa = &a;

    double b = 99.9, *pb = &b;

    char   c = '@', *pc = &c;

    //最初的值

    printf("&a=%#X,&b=%#X, &c=%#X\n", &a, &b, &c);

    printf("pa=%#X, pb=%#X,pc=%#X\n", pa, pb, pc);

    //加法运算

    pa++; pb++; pc++;

    printf("pa=%#X, pb=%#X,pc=%#X\n", pa, pb, pc);

    //减法运算

    pa -= 2; pb -= 2; pc -= 2;

    printf("pa=%#X, pb=%#X,pc=%#X\n", pa, pb, pc);

    //比较运算

    if(pa == paa){

        printf("%d\n",*paa);

    }else{

        printf("%d\n",*pa);

    }

    return 0;

}

 

运行结果:

&a=0X28FF44, &b=0X28FF30, &c=0X28FF2B

pa=0X28FF44, pb=0X28FF30, pc=0X28FF2B

pa=0X28FF48, pb=0X28FF38, pc=0X28FF2C

pa=0X28FF40, pb=0X28FF28, pc=0X28FF2A

2686784

 

从运算结果可以看出:papbpc每次加 1,它们的地址分别增加 481,正好是intdoublechar类型的长度;减 2 时,地址分别减少 8162,正好是 intdoublechar类型长度的 2 倍。

 

这很奇怪,指针变量加减运算的结果跟数据类型的长度有关,而不是简单地加 1或减 1,这是为什么呢?

apa为例,a 的类型为 int,占用 4个字节,pa 是指向 a 的指针,如下图所示:

 

 刚开始的时候,pa 指向 a 的开头,通过 *pa 读取数据时,从 pa 指向的位置向后移动 4 个字节,把这 4 个字节的内容作为要获取的数据,这 4 个字节也正好是变量 a 占用的内存。

 

 这个时候 pa 指向整数 a 的中间,*pa 使用的是红色虚线画出的 4 个字节,其中前 3 个是变量 a 的,后面 1 个是其它数据的,把它们搅和在一起显然没有实际的意义,取得的数据也会非常怪异。

如果pa++;使得地址加 4的话,正好能够完全跳过整数 a,指向它后面的内存,如下图所示:

 我们知道,数组中的所有元素在内存中是连续排列的,如果一个指针指向了数组中的某个元素,那么加 1就表示指向下一个元素,减 1就表示指向上一个元素,这样指针的加减运算就具有了现实的意义。

不过C语言并没有规定变量的存储方式,如果连续定义多个变量,它们有可能是挨着的,也有可能是分散的,这取决于变量的类型、编译器的实现以及具体的编译模式,所以对于指向普通变量的指针,我们往往不进行加减运算,虽然编译器并不会报错,但这样做没有意义,因为不知道它后面指向的是什么数据。

 

下面的例子是一个反面教材,警告不要尝试通过指针获取下一个变量的地址:

#include <stdio.h>

int main(){

    int a = 1, b = 2, c = 3;

    int *p = &c;

    int i;

    for(i=0; i<8; i++){

        printf("%d, ",*(p+i) );

    }

    return 0;

}

VS2010 Debug 模式下的运行结果为:

3, -858993460, -858993460, 2, -858993460, -858993460, 1, -858993460,

可以发现,变量 abc并不挨着,它们中间还参杂了别的辅助数据。

 指针变量除了可以参与加减运算,还可以参与比较运算。当对指针变量进行比较运算时,比较的是指针变量本身的值,也就是数据的地址。如果地址相等,那么两个指针就指向同一份数据,否则就指向不同的数据。

上面的代码(第一个例子)在比较pa paa 的值时,pa 已经指向了 a的上一份数据,所以它们不相等。而 a 的上一份数据又不知道是什么,所以会导致 printf()输出一个没有意义的数,这正好印证了上面的观点,不要对指向普通变量的指针进行加减运算。

另外需要说明的是,不能对指针变量进行乘法、除法、取余等其他运算,除了会发生语法错误,也没有实际的含义。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值