二、数组

一、线性表

1、定义

线性表(Linear List):零个或多个数据元素的有限序列

序列(有序):若元素存在多个,则第一个元素无前驱,最后一个无后继,其他每个元素都有且只有一个前驱和后继

2、数学表示

线性表:(a1, a2, a3, ..., ai-1, ai, ai+1, ..., an )
ai-1 是 ai 的直接前驱元素, ai+1 是 ai 的直接后继元素。线性表元素的个数为n(n≥0)定义为线性表的长度,当 n = 0 时,称为空表

3、线性表的抽象数据类型

ADT 线性表(List) 
Data
     	线性表的数据对象集合为{a1, a2, ......, an},每个元素的类型均为DataType。
     	其中,除第一个元素a1外,每一个元素有且只有一个直接前驱元素,     
     	除了最后一个元素an外,每一个元素有且只有一个直接后继元素。     	
	数据元素之间的关系是一对一的关系。 
Operation     
	InitList(*L):          初始化操作,建立一个空的线性表L。     	
	ListEmpty(L):          若线性表为空,返回true,否则返回false。     
	ClearList(*L):         将线性表清空。     
	GetElem(L, i, *e):     将线性表L中的第i个位置元素值返回给e。     
	LocateElem(L, e):      在线性表L中查找与给定值e相等的元素,
	                       如果查找成功,返回该元素在表中序号表示成功;    
	ListInsert(*L,i,e):    在L的第i个位置插入新元素e。     
	ListDelete(*L,i,*e):   删除L中的第i个元素,并用e返回其值。     
	ListLength(L):         返回L中的元素个数 endADT

二、数组(Array)概述

1、定义

数组是一种线性表数据结构。用一组连续的内存空间来存储一组具有相同类型的数据

解读:

  • 线性表:eg:数组、队列、栈、链表
  • 非线性表:eg:树、堆、图等
  • 连续内存空间 + 相同类型数据 =》随机访问

2、存储

在这里插入图片描述
==》元素存储的内存地址:

a[i]_address = base_address + i * data_type_size

其中, data_type_size 表示数组中每个元素的大小。

==》扩展:二维数组的内存寻址公式
对于 m*n 的数组,a[i][j] ( i < m, j < n )的地址为:

a[i][j]_address = base_address + ( i * n + j ) * type_size

三、数组的相关操作

低效的“插入”和“删除”

1、插入

(1)传统过程

将一个数据插入到数组中的第 k 个位置。为了把第 k 个位置腾出来,给新来的数据,需要将第 k~n 这部分的元素都顺序地往后挪一位。
==》
最好情况时间复杂度为 O(1)
最坏情况时间复杂度为 O(n)
平均情况时间复杂度为 (1+2+…n)/n=O(n)
在这里插入图片描述

(2)特殊场景

情况: 如果数组中存储的数据并没有任何规律,数组只是被当作一个存储数据的集合。
方法: 将第 k 位的数据搬移到数组元素的最后,把新的元素直接放入第 k 个位置。

==》复杂度为 O(1)

目标:将 x 插入第 3 个位置
a, b, c, d, e ==》a,b,x,d,e,c

2、删除

(1)传统过程

要删除第 k 个位置的数据,为了内存的连续性,也需要搬移数据。

==》
最好情况时间复杂度为 O(1)
最坏情况时间复杂度为 O(n)
平均情况时间复杂度为 (1+2+…n)/n=O(n)
在这里插入图片描述

(2)特殊场景

情况: 不一定非得追求数组中数据的连续性。
方法: 先记录下已经删除的数据(只记录数据被删除,不执行搬移数据的操作)。当数组没有更多空间存储数据时,触发真正的删除操作,也就是将多次删除操作集中在一起执行,从而提高删除的效率。

==》扩展: JVM 标记清除垃圾回收算法的核心思想

==》很多时候我们并不是要去死记硬背某个数据结构或者算法,而是要学习它背后的思想和处理技巧,这些东西才是最有价值的。

四、数组访问越界问题

1、示例

int main(int argc, char* argv[]){
	int i = 0;
	int arr[3] = {0};
	for(; i <= 3; i++){
		arr[i] = 0;
		printf("hello world\0");
	}
	return 0;
}

结果如下:
在这里插入图片描述
发生数组访问越界==》运行结果并非是打印三行“hello word”,而是四行“hello word”或无限打印“hello world”

2、分析

(1)在 C 语言中,只要不是访问受限的内存,所有的内存空间都是可以自由访问的。根据我们前面讲的数组寻址公式,a[3] 也会被定位到某块不属于数组的内存地址上,而这个地址正好是存储变量i 的内存地址(下面解释),那么 a[3]=0 就相当于 i=0,所以就会导致代码无限循环。

(2)函数体内的局部变量存在栈上,且是连续压栈。在Linux进程的内存布局中,栈区在高地址空间,从高向低增长。变量i和arr在相邻地址,且i比arr的地址大,所以arr越界正好访问到i。当然,前提是i和arr元素同类型,否则那段代码仍是未决行为。

五、容器 vs. 数组


很多语言都提供了容器类,比如 Java 中的 ArrayList、C++ STL 中的 vector。
容器类的最大的优势就是可以将很多数组操作的细节封装起来。
容器适用于业务开发,省时省力;非常底层的开发(网络框架等)或性能要求特别高,优先使用数组

  1. Java ArrayList 无法存储基本类型,比如int、long,需要封装为Integer、Long类,而 Autoboxing、Unboxing 则有一定的性能消耗,所以如果特别关注性能,或者希望使用基本类型,就可以选用数组。
  2. 如果数据大小事先已知,并且对数据的操作非常简单,用不到 ArrayList 提供的大部分方法,也可以直接使用数组。
  3. 表示多维数组时,用数组往往会更加直观。比如 Object[][] array;而用容器的话则需要这样定义:ArrayList<ArrayList> array。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值