数组取首末元素没有性能差距

JFS_Study

已于 2022-02-23 15:43:04 修改

阅读量277

点赞数

分类专栏：集合文章标签： java

于 2022-02-23 10:16:03 首次发布

本文链接：https://blog.csdn.net/ChineseSoftware/article/details/123083790

版权

集合专栏收录该内容

28 篇文章 1 订阅

订阅专栏

本文探讨了数组作为基础数据结构在编程中的使用。数组在内存中以连续线性方式存储，提供了高效的读取操作（O(1)），但插入、删除和查找操作的时间复杂度较高，分别为O(n)。对于查找性能，有序数组可以利用二分查找优化到O(logn)。在插入和删除性能方面，提出了牺牲索引有序性以换取更快操作的策略。此外，通过延迟操作和批量处理，可以优化频繁的删除和插入操作。

摘要由CSDN通过智能技术生成

一、简述

平时的业务开发中会经常出现数组(Array)一把梭的情况，大多数情况下都会用数组的形式进行操作，而有读源码习惯的开发者可能会发现，在一些底层库中，可能平时用数组的地方，底层库却选择了另外的数据结构，这是为什么?

二、什么是数组

数组是计算机科学中最基本的数据结构了，绝大多数编程语言都内置了这种数据结构，也是开发者最常见的数据结构。

数组是由相同类型的元素(element)的集合所组成的数据结构，分配一块连续的内存来存储。当然，在一些动态语言中例如 Python 的列表或者 JavaScript 的数组都可能是非连续性的内存，也可以存储不同类型的元素。如数组：arr = [1, 2, 3, 4, 5]。其在内存中的存储如图：

可以看到，这个数组在内存中是以连续线性的形式储存的。这个连续线性的储存形式既有其优势又有其劣势，只有搞清楚优劣才能在开发中更好地使用数组。

三、数组的特性

一个数据结构通常都有「插入、查找、删除、读取」这四种基本的操作。这里会逐一分析这些操作带来的性能差异。这里的性能并不是绝对意义上速度的快慢，因为不同的设备其硬件基础就会产生巨大的速度差异，这里的性能是在算法分析中的「复杂度」概念。

1️⃣插入性能

数组是一段连续储存的内存，当要将新元素插入到数组 k 的位置时，需要将 k 索引处之后的所有元素往后挪一位，并将 k 索引的位置插入新元素。

这个工作量相当大，通常情况下，插入操作的时间复杂度是 O(n)。

2️⃣删除性能

删除操作其实与插入很类似。假设删除数组之内的 k 索引位置的元素，在将其删除后，为了保持内存的连续性，需要将 k 之后的元素通通向前移动一位，这个情况的时间复杂度也是 O(n)。

3️⃣查找性能

比如查找某数组中是否存在一个为 2 的元素，计算机如何操作？计算机是从索引 0 开始往下匹配，直到匹配到 2 的元素为止。

这个查找的过程其实就是常见的线性查找，这个时候需要匹配的平均步数与数组的长度 n 有关，这个时间复杂度同样是 O(n)。

4️⃣读取性能

基于数组的特点拥有相同的数据类型和一块连续的线性内存，数组的读取性能非常的卓越，时间复杂度为 O(1)，相比于链表、二叉树等数据结构，它的优势非常明显。

那么数组是如何做到这么低的时间复杂度呢？假设数组内存起始地址为 start，而元素类型的长度为 size，数组索引为 i，那么很容易得到这个数组内存地址的寻址公式：arr[i]_address = start + size * i。比如要读取 arr[3] 的值，那么只需要把 3 代入寻址公式，计算机就可以一步查询到对应的元素，因此数组读取的时间复杂度只有 O(1)。

四、性能优化

数组操作，除「读取」外，其他「插入、查找、删除」的时间复杂度都在 O(n)，那么如何进行性能优化呢？

1️⃣查找性能优化

当数组的元素是无序状态下，只能用相对不太快的线性查找进行查找。当元素是有序状态(递增或者递减)，可以用另一种更高效的方法-----二分查找。

假设有一个 int[]，以递增的方式储存：arr = [1, 2, 3, 4, 5, 6, 7]

如果要查找值为 6 元素，按照线性查找的方式需要根据数组索引从 0 开始依次比对，直到碰到索引 5 的元素。而二分查找的效率则更高，由于知道此数组的元素是有序递增排列的：可以取一个索引为 3 的元素为中间值 p，将 p 与目标值 6 进行对比，发现 p 的值 4<6，那么此时由于是递增数组，目标值一定在索引 3 之后的元素中。此时，再在索引 3 之后到尾部的元素中取出新的中间值 p 与目标值比对，再重复下去，直到找到目标值。可以发现这样的操作每一次对比都能排除当前元素数量一半的元素，整体下来的时间复杂度只有 O(log n)，这表示此方法的效率极高。

这种高效的方法在数据量越大的情况下，越能体现出来。比如目前有一个 10 亿成员的数组是有序递增，如果按照线性查找，最差的情况下需要 10 亿此查找操作才能找到结果，而二分查找仅仅需要 7 次。

2️⃣插入性能优化

比如有以下数组，要将一个新成员 orange 插入索引 1 的位置，通常情况下需要后三位成员后移，orange 占据索引 1 的位置。但是需求不要求索引的有序性呢？也就是说，可以把数组当成一个集合概念，在索引 1 的位置插入 orange，并在数组的尾部开辟一个新内存将原本在 1 位置的 banana 存入新内存中，这样虽然索引乱了，但是整个操作仅仅需要 O(1) 的时间复杂度。

arr = ['apple','banana','grape','watermelon']

3️⃣删除性能优化

删除操作需要将删除位置后的元素集体向前移动，这非常消耗性能，尤其是在频繁的删除、插入操作中更是如此。可以先记录下相关的操作，但是并不立即进行删除，当到一定的节点时再一次性依据记录对数组进行操作，这样数组成员的反复频繁移动变成了一次性操作，可以很大程度上提高性能。