1.内存和地址
1.1 内存
我们知道在计算机上的CPU(中央处理器) 在处理数据的时候,需要的数据是在内存中读取的,处理后的数据也会放回内存中,那我们买电脑的时候,电脑上内存是8GB/16GB/32GB等,那这些内存空间如何高效管理呢?
其实也是把内存划分为一个个的内存单元,每个内存单元的大小取1个字节。
计算机中常见的单位(补充) :
一个比特位可以存储一个2进制的位1或者0
1 bit - 比特位
2 byte - 字节
3 KB
4 MB
5 GB
6 TB
7 PB
1 1byte = 8bit
2 1KB = 1024byte
3 1MB = 1024KB
4 1GB = 1024MB
5 1TB = 1024GB
6 1PB = 1024TB
其中每个内存单元,相当于我们的一个学生宿舍,一个字节空间里面能放8个比特位,就好比我们住的八人间,每个人是一个比特位。
每个内存单元也都有一个编号(相当于宿舍房间号),有了这个内存单元的编号,CPU可以快速找到一个内存空间。
在生活中我们把门牌号也叫地址,在计算机中我们把内存单元编号也称为地址。C语言里面给地址起了新的名字:指针。
可理解为: 内存单元的编号 == 地址 ==指针
CPU访问内存中的某个字节空间,必须知道这个字节空间在内存的什么位置,而因为内存中字节很多,所以需要给内存进行编址(就如同宿舍很多,需要给宿舍编号一样)。
计算机的编址,并不是把每个字节的地址记录下来,而是通过硬件设计完成的。
首先,必须理解,计算机内是有很多的硬件单元,而硬件单元是要互相协同工作的。所谓的协同,至少相互之间要能够进行数据传递。
但是硬件与硬件之间也是有大量的数据交互的,所以两者必须用线连起来。
不过,我们今天关心一组线,叫地址总线。
我们可以简单理解,32位机器有32 根地址总线,每根地址总线,每根线只有两态,表示0,1【电脉冲有无】,那么一根线,就能表示2种含义,2根线表示4种含义,以此类推。32根地址线,就能表示2^32种含义,每一种含义都代表一个地址。
地址信息被下达给内存,在内存上,就可以找到该地址对应的数据,将数据在通过数据总线传入CPU内存器。
2 指针变量和地址
2.1取地址操作符(&)
1 #include <stdio.h>
2 int main( )
3 {
4 int a = 10;
5 &a; //取出a的地址
6 printf("%p\n", &a);
7 return 0;
8 }
按照下面画图的列子,会打印处理:006FFD70&a取出的是a所占4个字节地址较小的字节的地址。
虽然整形变量占用四个字节,我们只要知道第一个字节地址,顺藤摸瓜访问到4个字节的数据也是可行的。
2.2 指针变量和解引用操作符(*)
那我们通过取地址符号(&)拿到的地址是一个数值,比如:这个数值有时候也是需要存储起来,方便后期再使用的,那我们把这样的地址值存放在哪里呢?答案是:指针变量中。
如:
1 #include
2 int main ( )
3 {
4 int a = 10;
5 int* pa = &a;
6
7 return 0;
8 }
指针变量也是一种变量,这种变量就是用来存放地址的,存放在指针变量中的值都会理解为地址。
如何拆解指针?
我们看到pa的类型是int*,我们该如何理解指针的类型呢?
1 int a = 10
2 int * pa = &a;
这里的pa左边写的是int*, *是说明pa是指针变量,而前面的int是在说明pa指向的是整形(int)类型的对象。
如何解引用操作符?
在现实生活中,我们使用地址要找到一个房间,在房间里可以拿去或者存放物品。
C语言中其实也是一样的,我们只要拿到了地址(指针),就可以通过地址(指针) 找到地址(指针)执行的对象,这里必须学习一个操作符,这里必须学习一个操作符解引用操作符(*)。
1 #include <stdio.h>
2
3 int main()
4 {
5 int a = 100;
6 int* pa = &a;
7 *pa = 0;
8 return 0;
9 }
上面代码第七行就使用了解引用操作符,*pa的意思就是通过pa中存放的地址,找到指向的空间,pa其实就是a的变量了;所以pa = 0,这个操作符是把a改成了0.
肯定有人在想为什么不直接写成 a=0,其实这里是把a的修改交给了pa来操作,这样对a的修改,就多了一种途径,写代码就会更加灵活,后期慢慢就能理解了。
3 指针变量类型的意义
指针变量的大小和类型是无关,只要是指针变量,在相同的平台下,大小都是一样的,为什么还要分类呢?
其实指针类型也是有特殊意义的,我们一起看接下来的。
3.1 指针的解引用
1 //代码1
2 #include <stdio.h>
3
4 int main()
5 {
6 int n = 0x11223344;
7 int *pi = &n;
8 *pi = 0;
9 return 0;
10 }
1 //代码2
2 #include <stdio.h>
3
4 int main()
5 {
6 int n = 0x11223344;
7 char *pc = (char *)&a;
8 *pc = 0;
9 return 0;
10 }
调试我们可以看到,代码1会将n的4个字节全部改为0,但是代码2只是将n的第一个字节改为0。
结论: 指针的类型决定了,对指针解引用的时候有多大的权限(一次能操作多少个字节)。
比如:char的指针解就只能访问一个字节,而int的指针能访问四个字节。
3.2 void*指针
在指针类型中有一种特殊的类型是viod类型的,可以理解为五具体类型的指针(或者叫泛型指针),这种类型的指针可以用来接受任意类型地址。但是也有局限性,void类型的指针不能直接进行指针的±整数和解引用的运算。
例如:
1 #include <stdio.h>
2
3 int main()
4 {
5 int a = 10;
6 int* pa = &a;
7 char* pc = &a;
8 return 0;
9 }
在上面的代码中,将一个int类型的变量的地址赋值给一个char类型的指针类型。编译器会给出了一个警告,原因是因为类型不兼容,而使用void类型就不会出现这样的问题。
4 const修饰指针
变量是可以修改的,如果把一个变量的地址交给一个指针变量,通过指针变量的也可以修改这个变量。但是如果我们希望一个变量加上一些限制,不能被修改,怎么做呢?这就是const的作用。
1 #include <stdio.h>
2 int main()
3 {
4 int m = 0;
5 m = 20;
6 const int n = 0;
7 n = 20;
8 return 0;
9 }
上述代码中n是不能被修改的,其实n本质是变量,只不过被const修饰后,在语法上加了限制,只要我们在代码中对n就行修改,就不符合语法规则,就报错,致使没法直接修改n。
5 指针运算
指针的基本运算有三种,分别是:
- 指针±整数
- 指针-指针
- 指针的关系运算
5.1 指针±整数
因为数组在内存中是连续的,只要知道第一个元素的地址,顺藤摸瓜就能找到后面的所有元素。
1 #include <stdio.h>
2 //指针+-整数
3 int main()
4 {
5 int arr[10] = {1,2,3,4,5,6,7,8,9,10};
6 int *p = &arr[0];
7 int i = 0;
8 int sz = sizeof(arr)/sizeof(arr[0]);
9 for(i=0; i<sz; i++)
10 {
11 printf("%d", *(p+i));
12 }
13 return 0;
14 }
5.2 指针-指针
1 #include <stdio.h>
2 int my_strlen(char *s)
3 {
4 char *p = s;
5 while(*p != '\0' )
6 p++;
7 return p-s;
8 }
9
10 int mian()
11 {
12 printf("%d\n",my_strlen("abc"));
13 return 0;
14 }
5.3 指针的关系运算
1 #include <stdio.h>
2
3 int main()
4 {
5 int arr[10] = {1,2,3,4,5,6,7,8,9,10};
6 int *p = &arr[0];
7 int i = 0;
8 int sz = sizeof(arr)/sizeof(arr[0]);
9 while(p<arr+sz)
10 {
11 printf("%d", *p);
12 }
13 return 0;
14 }
6 野指针
概念:野指针就是指向的位置是不可知的(随机的、不正确的、没有明确限制的)
如何避免野指针?
如果明确知道指针指向哪里就直接赋值地址,如果不知道指针应该指向哪里,可以给指针赋值NULL。NULL是C语言中定义的一个标识符常量,值是0,0也是地址,这个地址是无法使用的,读写该地址会报错。
7 assert 和 strlen
(1)assert.h头文件定义了宏assert(),用于在运行时确保程序符合指定条件,如果不符合,就报错终止运行。这个宏常常被称为“断言”。
(2)库函数strlen的功能是求字符串长度,统计的是字符串\0之前的字符个数。
8 数组名的理解
(1)sizeof(数组名),sizeof中单独放数组名,这里的数组名表示整个数组,计算的是整个数组的大小,单位是字节
(2)&数组名,这里的数组名表示整个数组,取出的是整个数组的地址(整个数组的地址和数组首元素的地址是有区别的)
除此之外,任何地方使用数组名,数组名都表示首元素的地址。