数组(Array)是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据。在面试的时候,面试官常常会问数组和链表的区别,很多人都回答说,“链表适合插入、删除,时间复杂度 O(1);数组适合查找,查找时间复杂度为 O(1)”。实际上,这种表述是不准确的。数组是适合查找操作,但是查找的时间复杂度并不为 O(1)。即便是排好序的数组,你用二分查找,时间复杂度也是 O(logn)。所以,正确的表述应该是,链表适合插入、删除,时间复杂度 O(1),数组支持随机访问,根据下标随机访问的时间复杂度为 O(1)。
目录
一、插入操作
假设数组的长度为 n且是有序的,现在,如果我们需要将一个数据插入到数组中的第 k 个位置。为了把第 k 个位置腾出来且保证顺序,给新来的数据,我们需要将第 k~n 这部分的元素都顺序地往后挪一位。那插入操作的时间复杂度是多少呢?
最好情况复杂度:在数组的末尾插入元素,不需要移动数据,这时的时间复杂度为 O(1)。
最坏情况复杂度:在数组的开头插入元素,所有的数据都需要依次往后移动一位,所以最坏时间复杂度是 O(n)。
平均情况复杂度:因为在每个位置插入元素的概率是一样的,所以平均情况时间复杂度为 (1+2+...n)/n=O(n)。
如果此时数组中存储的数据并没有任何规律,我们再往里面插入一条数据,复杂度又是多少呢?为了更好地理解,我们举一个例子。假设数组 a[10]中存储了如下 5 个元素:a,b,c,d,e。我们现在需要将元素 x 插入到第 3 个位置。我们只需要将 c 放入到 a[5],将 a[2]赋值为 x 即可,而无需做任何其他移动。最后,数组中的元素如下: a,b,x,d,e,c。
利用这种处理技巧,在特定场景下,在第 k 个位置插入一个元素的时间复杂度就会降为 O(1)。这个处理思想在快排中也会用到。
二、删除操作
跟插入数据类似,如果我们要删除第 k 个位置的数据,为了内存的连续性,也需要搬移数据,不然中间就会出现空洞,内存就不连续了。
和插入类似,如果删除数组末尾的数据,则最好情况时间复杂度为 O(1);如果删除开头的数据,则最坏情况时间复杂度为 O(n);平均情况时间复杂度也为 O(n)。
当然为了提高效率,我们可以将多个删除操作合并在一起 ,以提高删除效率。
C++ STL 中为我们提供了vector来封装数组,其支持动态扩容,每次扩容的大小为当前大小的1.5倍以减少拷贝操作。
三、总结
数组用一块连续的内存空间,来存储相同类型的一组数据,最大的特点就是支持随机访问,但插入、删除操作也因此变得比较低效,平均情况时间复杂度为 O(n)。在平时的业务开发中,我们可以直接使用编程语言提供的容器类,例如STL的vector,但是,如果是特别底层的开发,直接使用数组可能会更合适。
思考:
为什么大多数编程语言中,数组要从 0 开始编号,而不是从 1 开始呢?
我们先假设数组从 1 开始计数,那我们计算数组元素 a[k]的内存地址就会变为:
a[k]_address = base_address + (k-1)*type_size
而数组从 0 开始计数,计算数组元素 a[k]的内存地址就会变为:
a[k]_address = base_address + k*type_size
对比两个公式,我们不难发现,从 1 开始编号,每次随机访问数组元素都多了一次减法运算,对于 CPU 来说,就是多了一次减法指令。数组作为非常基础的数据结构,通过下标随机访问数组元素又是其非常基础的编程操作,效率的优化就要尽可能做到极致。所以为了减少一次减法操作,数组选择了从 0 开始编号,而不是从 1 开始。
当然历史原因也占了很大部分。
四、示例代码
// array.cpp : 定义控制台应用程序的入口点。
//
#include "stdafx.h"
#include <iostream>
#include <new>
//Array 数组实现
//定义
template<class T>
class Array
{
public :
Array(int MaxListSize=10); //构造函数
~Array() //析构函数
{
delete[] elements;
}
bool IsEmpty() const //判断是否为空
{
return length==0;
}
int Length() const //获取数组长度
{
return length;
}
bool Find(int k,T& x)const; //返回第k个元素到x中
int Search(const T& x)const; //查找元素值为x
int Delete(int k,T& x); //删除第K个元素,并将值赋值到x
int Insert(int k,const T& x); //插入第k个元素,其值为x
void Output() ;
private:
int length; //数组长度
int MaxSize; //数组最大长度
T *elements;//一维动态数组
};
//实现...
template<class T>
Array<T>::Array(int MaxListSize)
{
MaxSize=MaxListSize;
elements=new T[MaxSize];
length=0;
}
template<class T>
bool Array<T>::Find(int k,T& x)const
{
if(k<1||k>length)
{
return false;
}
x=elements[k-1];
return true;
}
template<class T>
int Array<T>::Search(const T& x)const
{
for(int i=0;i<length;i++)
{
if(elements[i]==x)
{
return ++i;
}
}
return -1;
}
template<class T>
int Array<T>::Delete(int k,T& x)
{
if(Find(k,x))
{
for(int i=k;i<length;i++)
{
elements[i-1]=elements[i];
}
length--;
return k;
}
else
{
return -1;
}
}
template<class T>
int Array<T>::Insert(int k,const T& x)
{
if(k<0||k>length||length==MaxSize)
{
return -1;
}
for(int i=length-1;i>=k;i--)
{
elements[i+1]=elements[i];
}
elements[k]=x;
length++;
return k;
}
template<class T>
void Array<T>::Output()
{
for(int i=0;i<length;i++)
{
std:: cout<<elements[i]<<" ";
}
std::cout<<std::endl;
}
void LinearListSample()
{
Array<int> L(5);
std::cout<<"Length= "<<L.Length()<<std::endl;
std::cout<<"IsEmpty= "<<L.IsEmpty()<<std::endl;
L.Insert(0,2);
L.Insert(1,6);
L.Output();
std::cout<<"IsEmpty="<<L.IsEmpty()<<std::endl;
int z;
L.Find(1,z);
std::cout<<"First elemet is "<<z<<std::endl;
std::cout<<"Length="<<L.Length()<<std::endl;
L.Delete(1,z);
std::cout<<"Deleted element is "<<z<<std::endl;
L.Output();
}
int main(int argc, _TCHAR* argv[])
{
LinearListSample();
//暂停操作
char str;
std::cin>>str;
//程序结束
return 0;
}
结果如下: