8.1、指针基本介绍

本文详细解释了指针在C语言中的作用,包括内存地址的编号、指针变量的定义与使用、通过指针访问和修改数据、指针运算(加减、比较)以及注意事项。

  • 指针即内存的地址。指针变量即保存了内存地址的变量。
  • 计算机中所有的数据都必须放在内存中,不同类型的数据占用的字节数不一样,如 int 占用 4 个字节,char 占用 1 个字节。为了正确地访问这些数据,必须为每个字节都编上号码(就像门牌号、身份证号一样),每个字节的编号是唯一的,根据编号可以准确地找到某个字节。
  • 4G 内存中每个字节的编号(十六进制):

  • 我们将内存中字节的编号称为地址(Address)或指针(Pointer)。
  • 地址从 0 开始依次增加,对于 32 位环境,程序能够使用的内存为 4GB,最小的地址为 0,最大的地址为 0XFFFFFFFF
  • 示例:输出一个地址
#include <stdio.h>

int main(){
    int a = 100;
    char str[20] = "huangjiayue";
    // %#X 表示以十六进制形式输出, 并附带前缀 0X
    // a 是一个变量, 用来存放整数, 需要在前面加 & 来获得它的地址
    // str 本身就表示字符串的首地址, 不需要加 &
    printf("%#X, %#X\n", &a, str);
    return 0;
}

/*
0X67167CAC, 0X67167C90
*/
  • C 语言中有一个控制符%p,专门用来以十六进制形式输出地址,但%p的输出格式并不统一,有的编译器带0x前缀,有的不带,所以此处并没有采用。

1、一切都是地址

  • C 语言用变量来存储数据,用函数来定义一段可以重复使用的代码,它们最终都要放到内存中才能供 CPU 使用。
  • 数据和代码都以二进制的形式存储在内存中,计算机无法从格式上区分某块内存到底存储的是数据还是代码。当程序被加载到内存后,操作系统会给不同的内存块指定不同的权限:
    • 拥有读取和执行权限的内存块是代码
    • 拥有读取和写入权限(也可能只有读取权限)的内存块是数据
  • CPU 只能通过地址来取得内存中的代码和数据,程序在执行过程中会告知 CPU 要执行的代码以及要读写的数据的地址。如果在 CPU 要写入数据时给它一个代码区域的地址,就会发生内存访问错误。这种内存访问错误会被硬件和操作系统拦截,强制程序崩溃。
  • CPU 访问内存时需要的是地址,而不是变量名和函数名!变量名和函数名只是地址的一种助记符,当源文件被编译和链接成可执行程序后,它们都会被替换成地址。编译和链接过程的一项重要任务就是找到这些名称所对应的地址。
  • 假设变量 a、b、c 在内存中的地址分别是0X10000X20000X3000,则加法运算c = a + b;将会被转换成类似下面的形式:
    • 0X3000 = (0X1000) + (0X2000);
    • ( )表示取值操作,整个表达式的意思是,取出地址0X10000X2000上的值,将它们相加,把相加的结果赋值给地址为0X3000的内存
  • 变量名和函数名使得在编写代码的过程中可以使用易于阅读和理解的英文字符串,不用直接面对二进制地址。
  • 注意:虽然变量名、函数名、字符串名和数组名在本质上是一样的,它们都是地址的助记符,但在编写代码的过程中,我们认为:
    • 变量名表示的是数据本身
    • 函数名、字符串名和数组名表示的是代码块或数据块的首地址

2、指针变量

  • 数据在内存中的地址也称为指针,如果一个变量存储了一份数据的指针,这种变量称为指针变量。
  • 指针变量的值就是某份数据的地址,这样的一份数据可以是数组、字符串、函数,也可以是另外的一个普通变量或指针变量。
  • 现在假设有一个char类型的变量c,它存储了字符'K'(ASCII 码为十进制数 75),并占用了地址为0X11A的内存(地址通常用十六进制表示)。另外有一个指针变量p,它的值为0X11A(正好等于变量c的地址),这种情况就称p指向了c,或者说p是指向变量c的指针。

(1)定义指针变量

  • 定义指针变量与定义普通变量非常类似,不过要在变量名前面加星号*
    • datatype *name;
    • 或:
    • datatype *name = value;
  • *表示这是一个指针变量,datatype表示该指针变量所指向的数据的类型 。
// jy: p1 是一个指向 int 类型数据的指针变量; 至于 p1 究竟指向哪一份数据, 应该由赋予它的值决定
int *p1;

int a = 100;
// jy: 在定义指针变量 p_a 的同时对它进行初始化, 并将变量 a 的地址赋予它, 此时 p_a 就指向了 a
//     注意: p_a 需要的是一个地址, a 前面必须要加取地址符 &
int *p_a = &a;
  • 和普通变量一样,指针变量也可以被多次写入,且随时都能够改变指针变量的值:
// 定义普通变量
float a = 99.5, b = 10.6;
char c = '@', d = '#';

// 定义指针变量
float *p1 = &a;
char *p2 = &c;

// 修改指针变量的值
p1 = &b;
p2 = &d;
  • *是一个特殊符号,表明一个变量是指针变量,定义p1p2时必须带*。而给 p1、p2 赋值时,因为已经知道它是一个指针变量,就没必要多此一举再带上*,后边可以像使用普通变量一样来使用指针变量。定义指针变量时必须带*,给指针变量赋值时不能带*
  • 假设变量 a、b、c、d 的地址分别为 0X1000、0X1004、0X2000、0X2004,下面的示意图很好地反映了 p1、p2 指向的变化:

  • 注意:p1、p2 的类型分别是float*char*,而不是 float 和 char,它们是完全不同的数据类型。
// 指针变量也可以连续定义:
int *a, *b, *c;  // a、b、c 的类型都是 int*

// 只有 a 是指针变量,b、c 都是类型为 int 的普通变量
int *a, b, c;

(2)通过指针变量取得数据

  • 指针变量存储了数据的地址,通过指针变量能够获得该地址上的数据:
    • *pointer;
    • *为指针运算符,用来取得某个地址上的数据
#include <stdio.h>

int main(){
    int a = 15;
    int *p = &a;
    printf("%d, %d\n", a, *p);  //两种方式都可以输出a的值
    return 0;
}

/*
15, 15
*/
  • 假设 a 的地址是 0X1000,p 指向 a 后,p 本身的值也会变为 0X1000,*p表示获取地址 0X1000 上的数据,也即变量 a 的值。从运行结果看,*p和 a 是等价的。
  • CPU 读写数据必须要知道数据在内存中的地址,普通变量和指针变量都是地址的助记符,虽然通过*pa获取到的数据一样,但它们的运行过程稍有不同:
    • a只需要一次运算就能够取得数据
    • *p要经过两次运算,多了一层“间接”。
  • 假设变量 a、p 的地址分别为 0X1000、0XF0A0,它们的指向关系:

  • 程序被编译和链接后,a、p 被替换成相应的地址。
    • *p要先通过地址 0XF0A0 取得变量 p 本身的值(即变量 a 的地址),然后再通过这个值取得变量 a 的数据,前后共有两次运算
    • 而使用 a 的话,可以通过地址 0X1000 直接取得它的数据,只需要一步运算。
  • 使用指针是间接获取数据,使用变量名是直接获取数据,前者比后者的代价要高。
  • 指针除了可以获取内存上的数据,也可以修改内存上的数据:
#include <stdio.h>

int main(){
    int a = 15, b = 99, c = 222;
    int *p = &a;  // 定义指针变量
    *p = b;       // 通过指针变量修改内存上的数据
    c = *p;       // 通过指针变量获取内存上的数据
    printf("%d, %d, %d, %d\n", a, b, c, *p);
    return 0;
}

/*
99, 99, 99, 99
*/
  • *p代表的是a中的数据,它等价于a,可以将另外的一份数据赋值给它,也可以将它赋值给另外的一个变量。
  • *在不同的场景下有不同的作用:
    • *可以用在指针变量的定义中,表明这是一个指针变量,以和普通变量区分开
    • 使用指针变量时在前面加*表示获取指针指向的数据
  • 定义指针变量时的*和使用指针变量时的*意义完全不同:
int *p = &a;  // * 用来指明 p 是一个指针变量
*p = 100;     // * 用来获取指针指向的数据
  • 注意:给指针变量本身赋值时不能加*
int *p;

// p 前面不能加 *
p = &a;      
*p = 100;
  • 指针变量可以出现在普通变量能出现的任何表达式中:
int x, y, *px = &x, *py = &y;
y = *px + 5;  // 表示把 x 的内容加 5 并赋给 y, *px+5 相当于 (*px)+5
y = ++*px;    // px 的内容加上 1 之后赋给 y, ++*px 相当于 ++(*px)
y = *px++;    // 相当于 y=*(px++)
py = px;      // 把一个指针的值赋给另一个指针
  • 通过指针交换两个变量的值
#include <stdio.h>

int main(){
    int a = 100, b = 999, temp;
    int *pa = &a, *pb = &b;
    printf("a=%d, b=%d\n", a, b);
    
    temp = *pa;  // 将 a 的值先保存起来
    *pa = *pb;   // 将 b 的值交给 a
    *pb = temp;  // 再将保存起来的 a 的值交给 b
    
    printf("a=%d, b=%d\n", a, b);
    return 0;
}

/*
运行结果:
a=100, b=999
a=999, b=100
*/

(3)关于 * 和 & 的谜题

  • 假设有一个 int 类型的变量 a,pa 是指向它的指针,那么*&a&*pa分别是什么意思呢?
    • *&a可以理解为*(&a)
      • &a表示取变量 a 的地址(等价于 pa)
      • *(&a)表示取这个地址上的数据(等价于*pa),即*&a仍然等价于a
    • &*pa可以理解为&(*pa)
      • *pa表示取得pa指向的数据(等价于a
      • &(*pa)表示数据的地址(等价于&a),即&*pa等价于pa

(4)对星号*的总结

  • 在目前所学到的语法中,星号*主要有三种用途:
    • 表示乘法,如int a = 3, b = 5, c; c = a * b;
    • 表示定义一个指针变量,以和普通变量区分开,如int a = 100; int *p = &a;
    • 表示获取指针指向的数据,是一种间接操作,如int a, b, *p = &a; *p = 100; b = *p;

3、指针变量的运算(加、减、比较)

  • 指针变量保存的是地址,而地址本质上是一个整数,所以指针变量可以进行部分运算,如:加、减、比较:
#include <stdio.h>

int main(){
    int    a = 10,   *pa = &a, *paa = &a;
    double b = 99.9, *pb = &b;
    char   c = '@',  *pc = &c;
    // 最初的值
    printf("&a=%#X, &b=%#X, &c=%#X\n", &a, &b, &c);
    printf("pa=%#X, pb=%#X, pc=%#X\n", pa, pb, pc);
    // 加法运算
    pa++; pb++; pc++;
    printf("pa=%#X, pb=%#X, pc=%#X\n", pa, pb, pc);
    // 减法运算
    pa -= 2; pb -= 2; pc -= 2;
    printf("pa=%#X, pb=%#X, pc=%#X\n", pa, pb, pc);
    // 比较运算
    if(pa == paa){
        printf("%d\n", *paa);
    }else{
        printf("%d\n", *pa);
    }
    return 0;
}

/*
&a=0X513CD58C, &b=0X513CD580, &c=0X513CD57F
pa=0X513CD58C, pb=0X513CD580, pc=0X513CD57F
pa=0X513CD590, pb=0X513CD588, pc=0X513CD580
pa=0X513CD588, pb=0X513CD578, pc=0X513CD57E
0
*/
  • 从运算结果可以看出:pa、pb、pc 每次加 1时,它们的地址分别增加 4、8、1(对应 int、double、char 类型的长度);减 2 时,地址分别减少 8、16、2(对应 int、double、char 类型长度的 2 倍)。
  • 指针变量加减运算的结果跟数据类型的长度有关,而不是简单地加 1 或减 1。以 a 和 pa 为例,a 的类型为 int,占用 4 个字节,pa 是指向 a 的指针:

  • 刚开始的时候,pa 指向 a 的开头,通过*pa读取数据时,从 pa 指向的位置向后移动 4 个字节,把这 4 个字节的内容作为要获取的数据,这 4 个字节也正好是变量 a 占用的内存。
  • 如果pa++;使得地址加 1 的话,就会变成如下图所示的指向关系:

  • 这时 pa 指向整数 a 的中间,*pa使用的是橙色虚线画出的 4 个字节,其中前 3 个是变量 a 的,后面 1 个是其它数据的,把它们“搅和”在一起显然没有实际的意义,取得的数据也会非常怪异。
  • 如果pa++;使得地址加 4 的话,正好能够完全跳过整数 a,指向它后面的内存:

  • 数组中的所有元素在内存中是连续排列的,如果一个指针指向了数组中的某个元素,那么加 1 就表示指向下一个元素,减 1 就表示指向上一个元素,这样指针的加减运算就具有了现实的意义。
  • 不过 C 语言并没有规定变量的存储方式,如果连续定义多个变量,它们有可能是挨着的,也有可能是分散的,这取决于变量的类型、编译器的实现以及具体的编译模式,所以对于指向普通变量的指针,往往不进行加减运算,虽然编译器并不会报错,但这样做没有意义,因为不知道它后面指向的是什么数据。
  • 示例(反面教材,不要尝试通过指针获取下一个变量的地址):
#include <stdio.h>

int main(){
    int a = 1, b = 2, c = 3;
    int *p = &c;
    int i;
    for(i=0; i<8; i++){
        printf("%d, ", *(p+i));
    }
    return 0;
}
  • gcc 编译器下的运行结果为(每次执行的结果略有区别):
    • 3, 1882340100, 32766, 1882340352, 2, 1, 6, 4195840,
  • 可以发现,变量 a、b、c 并不挨着,它们中间还参杂了别的辅助数据。
  • 指针变量除了可以参与加减运算,还可以参与比较运算。当对指针变量进行比较运算时,比较的是指针变量本身的值(即数据的地址)。如果地址相等,那么两个指针就指向同一份数据,否则就指向不同的数据。
  • 上面的代码(第一个例子)在比较 pa 和 paa 的值时,pa 已经指向了 a 的上一份数据,所以它们不相等。而 a 的上一份数据又不知道是什么,所以会导致 printf() 输出一个没有意义的数。
    • 不要对指向普通变量的指针进行加减运算。
  • 注意:不能对指针变量进行乘法、除法、取余等其他运算,除了会发生语法错误,也没有实际的含义。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

融码一生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值