二、数组

最新推荐文章于 2023-12-30 12:19:45 发布

__盛夏光年__

最新推荐文章于 2023-12-30 12:19:45 发布

阅读量1.2k

点赞数 5

分类专栏：数据结构与算法文章标签：数据结构与算法数组

本文链接：https://blog.csdn.net/u012736685/article/details/83029006

版权

数据结构与算法专栏收录该内容

25 篇文章 2 订阅

订阅专栏

一、线性表

1、定义

线性表(Linear List)：零个或多个数据元素的有限序列。

序列（有序）：若元素存在多个，则第一个元素无前驱，最后一个无后继，其他每个元素都有且只有一个前驱和后继

2、数学表示

线性表：(a1, a2, a3, ..., ai-1, ai, ai+1, ..., an )
ai-1 是 ai 的直接前驱元素, ai+1 是 ai 的直接后继元素。线性表元素的个数为n（n≥0）定义为线性表的长度，当 n = 0 时，称为空表

3、线性表的抽象数据类型

ADT 线性表(List) 
Data
     	线性表的数据对象集合为{a1, a2, ......, an}，每个元素的类型均为DataType。
     	其中，除第一个元素a1外，每一个元素有且只有一个直接前驱元素，     
     	除了最后一个元素an外，每一个元素有且只有一个直接后继元素。     	
	数据元素之间的关系是一对一的关系。 
Operation     
	InitList(*L):          初始化操作，建立一个空的线性表L。     	
	ListEmpty(L):          若线性表为空，返回true，否则返回false。     
	ClearList(*L):         将线性表清空。     
	GetElem(L, i, *e):     将线性表L中的第i个位置元素值返回给e。     
	LocateElem(L, e):      在线性表L中查找与给定值e相等的元素，
	                       如果查找成功，返回该元素在表中序号表示成功；    
	ListInsert(*L,i,e):    在L的第i个位置插入新元素e。     
	ListDelete(*L,i,*e):   删除L中的第i个元素，并用e返回其值。     
	ListLength(L):         返回L中的元素个数 endADT

二、数组（Array）概述

1、定义

数组是一种线性表数据结构。用一组连续的内存空间来存储一组具有相同类型的数据

解读：

线性表：eg：数组、队列、栈、链表
非线性表：eg：树、堆、图等
连续内存空间 + 相同类型数据 =》随机访问

2、存储

在这里插入图片描述
==》元素存储的内存地址：

a[i]_address = base_address + i * data_type_size

其中， data_type_size 表示数组中每个元素的大小。

==》扩展：二维数组的内存寻址公式
对于 m*n 的数组，a[i][j] ( i < m, j < n )的地址为：

a[i][j]_address = base_address + ( i * n + j ) * type_size

三、数组的相关操作

低效的“插入”和“删除”

1、插入

（1）传统过程

将一个数据插入到数组中的第 k 个位置。为了把第 k 个位置腾出来，给新来的数据，需要将第 k～n 这部分的元素都顺序地往后挪一位。
==》
最好情况时间复杂度为 O(1)
最坏情况时间复杂度为 O(n)
平均情况时间复杂度为 (1+2+…n)/n=O(n)
在这里插入图片描述

（2）特殊场景

情况： 如果数组中存储的数据并没有任何规律，数组只是被当作一个存储数据的集合。
方法： 将第 k 位的数据搬移到数组元素的最后，把新的元素直接放入第 k 个位置。

==》复杂度为 O(1)

目标：将 x 插入第 3 个位置
a, b, c, d, e ==》a，b，x，d，e，c

2、删除

（1）传统过程

要删除第 k 个位置的数据，为了内存的连续性，也需要搬移数据。

==》
最好情况时间复杂度为 O(1)
最坏情况时间复杂度为 O(n)
平均情况时间复杂度为 (1+2+…n)/n=O(n)
在这里插入图片描述

（2）特殊场景

情况： 不一定非得追求数组中数据的连续性。
方法： 先记录下已经删除的数据（只记录数据被删除，不执行搬移数据的操作）。当数组没有更多空间存储数据时，触发真正的删除操作，也就是将多次删除操作集中在一起执行，从而提高删除的效率。

==》扩展： JVM 标记清除垃圾回收算法的核心思想

==》很多时候我们并不是要去死记硬背某个数据结构或者算法，而是要学习它背后的思想和处理技巧，这些东西才是最有价值的。

四、数组访问越界问题

1、示例

int main(int argc, char* argv[]){
	int i = 0;
	int arr[3] = {0};
	for(; i <= 3; i++){
		arr[i] = 0;
		printf("hello world\0");
	}
	return 0;
}

结果如下：
在这里插入图片描述
发生数组访问越界==》运行结果并非是打印三行“hello word”，而是四行“hello word”或无限打印“hello world”

2、分析

（1）在 C 语言中，只要不是访问受限的内存，所有的内存空间都是可以自由访问的。根据我们前面讲的数组寻址公式，a[3] 也会被定位到某块不属于数组的内存地址上，而这个地址正好是存储变量i 的内存地址（下面解释），那么 a[3]=0 就相当于 i=0，所以就会导致代码无限循环。

（2）函数体内的局部变量存在栈上，且是连续压栈。在Linux进程的内存布局中，栈区在高地址空间，从高向低增长。变量i和arr在相邻地址，且i比arr的地址大，所以arr越界正好访问到i。当然，前提是i和arr元素同类型，否则那段代码仍是未决行为。

五、容器 vs. 数组

很多语言都提供了容器类，比如 Java 中的 ArrayList、C++ STL 中的 vector。
容器类的最大的优势就是可以将很多数组操作的细节封装起来。
容器适用于业务开发，省时省力；非常底层的开发（网络框架等）或性能要求特别高，优先使用数组

Java ArrayList 无法存储基本类型，比如int、long，需要封装为Integer、Long类，而 Autoboxing、Unboxing 则有一定的性能消耗，所以如果特别关注性能，或者希望使用基本类型，就可以选用数组。
如果数据大小事先已知，并且对数据的操作非常简单，用不到 ArrayList 提供的大部分方法，也可以直接使用数组。
表示多维数组时，用数组往往会更加直观。比如 Object[][] array；而用容器的话则需要这样定义：ArrayList<ArrayList> array。