C语言总结之数组
前言
平时很多地方都有用到数组,也零零碎碎的看过很多关于数组相关的知识,正好这两天有时间,就系统的回顾总结一下有关数组的相关知识,供大家参考学习,也是作为后续查询回顾的一个备份记录。
一、数组是什么?
- 定义: 按顺序存储的一系列数据类型相同的值组成
- 声明: 使用数组时,通过声明数组告诉编译器数组中内含多少元素和这些元素的类型。编译器根据
这些信息正确的创建数组,并为其在内存中开辟一段连续的存储空间进行存储。
数据类型 数组名[常量表达式]
int array[10]
数据类型:int; 表示数组中的元素的类型是int
数组名:array;
常量表达式:10; 表示数组array的元素有10个,从0开始到9结束,总共10个数。
- 初始化: 用以逗号分隔的值列表(用花括号括起来)初始化数组,各值之间用逗号分隔。在逗号和值之间可以使用空格。要访问数组中的元素,通过使用数组下标(也称为索引)表示数组中的各元素,数组元素的标号从0开始。
/* code one */
1> int array[5] = {1, 2, 3, 4, 5};
通常使用符号常量表示数组的大小,这样比较方便,例如code two的第2行所示,这样如果需要改变数组的大小,只需要修改define的代码即可,不用在程序中查询所有使用过数组大小的地方;
/* code two */
/* 初始化数组,使用指定初始化器 */
1> #include <stdio.h>
2> #define DAYS 7
3> int main(void){
4> int array[DAYS] = {2, 3, [3] = 7, 70, [1] = 5 };
5> int star[] = {1, 2, 3};
6> int num = 0;
7> for(num = 0; num < DAYS; num ++){
8> printf("%2d %d\n", num +1, array[num]);
9> }
10> return 0;
11>}
① 当初始化列表中的值少于数组元素个数时,编译器会把剩余的元素都初始化为0,如code two中数组array的第3,6,7个元素的初始化值;
② 可以省略方括号中的数字,让编译器自动匹配数组大小和初始化列表中的项数,如code two 的star数组,其内部含有三个整型元素;
③ 可以使用指定初始化器(C99),初始化指定的数组元素,如code two 的array[3]的初始化(即数组的第四个元素),如果再次初始化指定的元素,那么最后的初始化将会取代之前的初始化,比如array的第二各元素,刚开始被初始化为3,后又被初始化为5;
- 给数组元素赋值: 声明数组后,可以借助数组下标给数组元素赋值,C语言不允许数组作为一个单元赋给另外一个数组,除了初始化外也不允许使用花括号列表的形式赋值;
- 数组边界: 在使用数组时,要防止数组下标超出边界,编译器不会检查数组的使用是否越界。使用越界下标的结果是未定义的。如code three 所示:
/* code three */
1> #include <stdio.h>
2> #define SIZE 3
3> int main(void){
4> int varA = 88, varB = 99;
5> int array[SIZE];
6> int num;
7> printf("the varA value is %8d, address is %p\n", varA, &varA);
8> printf("the varB value is %8d, address is %p\n", varB, &varB);
9> for(num = -1; num < 7; num++){
10> array[num] = 2*num;
11> printf("the array[%2d] value is %8d, address is %p\n", num, array[num], &array[num]);
12> }
13> printf("the varA value is %8d, address is %p\n", varA, &varA);
14> printf("the varB value is %8d, address is %p\n", varB, &varB);
15> return 0;
16}
根据编译结果看,编译器把变量varA和array[6]放在了一起,对应的内存地址相同,当对array[6]赋值以后,同样也改变了varA的值,也就是由88改变成了12(由图中红色方框所示);同样的varB和array[5]也一样。所以,使用越界的数组下标会导致程序改变其他变量的值。不同的编译器运行该程序的结果可能不同,有些会导致程序异常终止。
C 语言之所以不检查边界,其目的是为了程序可以运行更快,编译器没有必要捕获所有的下标错误。因为在程序运行之前,数组的下标可能尚未确定,如果为了安全,编译器必须在运行时添加额外的代码检查数组的每个下标值,这会降低程序的运行速度,并且下标引用可以作用于任意指针,而不仅仅是数组名。
- 数组、指针初体验
先了解几个知识点,后面会专门介绍指针和数组之间的恩怨情仇
① 在几乎所有使用数组名的表达式中,数组名的值是一个指针常量,也就是数组第一个元素的地址。这里并不能得出数组和指针一样的结论:数据具有一些和指针完全不同的特征,例如:数组具有确定数量的元素,而指针只是一个标量值。
② 只有当数组名在表达式中使用时,编译器才会为它产生一个指针常量,且不能被修改;在两种场合下,数组名不能用指针常量来表示:1、数组名作为sizeof操作符的操作数 。 返回整个数组的长度,而不是指向数组的指针的长度 2、作为单目操作符&的操作数。 取一个数组名地址所产生的是一个指向数组的指针,并不是指向某个指针常量值的指针。
③ 除了优先级之外,下标引用和间接访问完全相同例如:array[subscript]等价于*(array+(subscript))
二、多维数组
-
对声明的理解: int array[3][4];
先看离数组名最近的下标,也就是array[3],表示array是一个内含3个元素的数组;至于每个元素的具体情况,需要查看声明的剩余部分,即int [4],表示一个内含4个int型元素的数组;合起来理解就是:array是一个内含3个数组元素的数组,每个数组元素内含4个int类型的元素; -
内存存储顺序: 在计算机内部,array[3][4]这样的数组是按照顺序储存的,也就是从第一个内含4个int型元素的数组开始,然后是第2个内含4个int型元素的数组,以此类推,也就是常说的按照最右边的下标率先变化的原则,即行主序。
-
应用: 关于多维数组(基本上二维数组居多)的使用,与指针,指针的指针是分不开的,后面说完指针的基础知识后,会对指针数组和数组指针有一个详细的论述总结。
三、数组名
当一个数组名作为函数参数传递给一个函数时,应该怎样去理解呢?
数组名的值就是一个指向数组第一个元素的指针,所以当数组名作为函数参数时传递给函数的是一份该指针的拷贝,函数里面的下标引用实际上就是对这个指针执行间接访问操作,并且通过这种间接访问,函数是可以访问和修改调用程序的数组元素(code five_19>)。
/* code five */
1> #include <stdio.h>
2> #define SIZE 3
3> int arrCopy(int x[], int y[], int num);
4> int main(void){
5> int arrA[SIZE] = {2, 3, 4};
6> int arrB[SIZE] = {7, 8, 9};
7> int n;
8> printf("the arrA address is %p\n", arrA);
9> arrCopy(arrA, arrB, SIZE);
10> for(n=0; n<SIZE; n++){
11> printf("the arrA[%d] = %d, address is %p\n", n, arrA[n], &arrA[n]);
12> }
13> printf("the arrA address is %p\n", arrA);
14> return 0;
15>}
16> int arrCopy(int x[], int y[], int num){
17> int i;
18> for(i = 0; i<num; i++){
19> x[i] = y[i];
20> }
21> x++;
22> return 0;
23>}
数组名参数似乎是传址调用(通过传递一个指向所需元素的指针,然后再函数中对该指针执行间接访问操作实现对数据的访问);但是我们可以试着以传值调用的角度理解数组名作为函数参数应用:其传递给函数的是参数的一份拷贝(指向数组起始位置的指针的拷贝),函数可以自由的操作它的指针形参(如果执行了间接访问操作,那么就可以修改那个变量(参见code five_19及对应编译结果)),不必担心会修改对应的作为实参的指针(上述红色框对应内容,arrA的地址没有被修改)。
总结
说起数组,很难把它和指针单独出来分别讨论,数组的相关应用还有很多,这里就简单的论述总结一下,后续会有一些非常有意思的名词供我们学习总结应用。eg:数组指针,指针数组,函数指针,指针函数等等。