数据结构总结（摘抄）（二）

最新推荐文章于 2024-10-17 09:17:09 发布

jifengshuai

最新推荐文章于 2024-10-17 09:17:09 发布

阅读量614

点赞数

分类专栏：数据结构学习文章标签：数据结构存储算法磁盘 pivot n2

数据结构学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

（三）专用数据结构

专用数据结构有栈，队，和优先级队列。这些结构不是为了用户可访问的数据库而建立的，通常用他们在程序中辅助实现一些算法。如图，带权图

栈，队，和优先级队列是抽象数据类型（ADT），它们又由一些更加基础的结构如数组、链表或堆（如在优先级队列中）组成。这些ADT只提供给用户简单的借口，一般仅允许插入和访问或者删除一个数据项。

这些数据项是：

对于栈：最后被插入的数据项

对于队：最先被插入的数据项

对于优先级队列：具有最高优先级的数据项

这些ADT可以被当做帮助理解的概念。他们的功能可以通过直接使用基础结构（如数组）来实现，但是他们提供的精简的接口可以简化许多问题。

栈

栈只对最后被插入数据项访问的时候，它是一个后进先出的结构。

栈往往通过数组或链表实现，通过数组实现很有效率，因为最后被插入的数据总是在数组的最后，这个位置是数据最容易删除。栈的溢出有可能出现，但当数组的大小被合理的规划后，溢出并不常见，因为栈很少会拥有大量的数据。

如果栈拥有许多数据，并且数量或插入一个元素很方便。除非整个内存满了，栈的溢出不可能出现。链表比数组稍慢一些，因为对于插入一个新连接必须分配内存，从表中某连接点上删除元素后回收分配内存是必需的。

队列

队用在只对最先被插入的数据项访问的时候，他是一个先进先出的结构。

同栈相比，队同样可以通过数组和链表实现。这两种方法都很有效率。数组需要附加的程序来处理队在数组尾部回绕的情况。链表必须是双端的，这样才能从一端从另一端删除。

用数组还是链表来实现队的选择是通过数据量是否可以被很好地预测来决定的，如果知道有多少数据量的话，就用数组，否则的话就用链表。

优先级队列

优先级队列可以用有序数组或堆来实现，向有序数组中插入式很慢的，但是删除很快。使用堆来实现优先级队列，插入和删除的时间复杂度都是O（logN）级

当插入速度不重要时，可以使用数组或双端链表。当数据量可以被预测时，使用数组，当数据量未知时，使用链表，如果速度很重要的话，选择堆更好一些。

数据结构	插入	删除	注释
栈（数组或链表）	O(1)	O(1)	删除最先插入的
队（数组或链表）	O(1)	O(1)	删除最后插入的
优先级队列（有序数组）	O(N)	O(1)	删除优先级最高的
优先级队列（堆）	O(logN)	O(logN)

排序：

当选择数据结构时，可以先尝试一种较慢但简单的排序，例如插入排序。如果采用了这些方法，现代计算机的快速处理速度也有可能在恰当的时间内将较大的数据量排序。（比较粗略的估计是，较慢的排序对于少于1000的数据量为宜。）

插入排序对几乎已排好的文件很有效，如果没有太多的元素处于乱序的位置上，操作的时间复杂度大约在O(N²)(先写出‘2’，然后选中按‘ctrl+shift+=’)级，这通常发生在往一个已排好序的文件中插入一些新的数据元素的情况。

如果插入排序显得太慢，下一步可以尝试希尔排序，它很容易实现，并且使用起来不会因为条件不允许而性能差距太大；估计在5000以下很有用，

只有当希尔排序显得太慢，你才应该使用更复杂但更快速的方法：归并排序、堆排序或快速排序。归并排序需要辅助存储空间，堆排序需要一个堆的数据结构，前两者都比较快速排序在某些程度上慢，所以当需要最短的排序时间时经常选择快速排序。

归并算法的中心是归并两个已经有序的数组。归并两个有序数组A和B，就生成了第三个数组C。所以归并排序的思想是把一个数组分成两半，排序每一半，然后在归并在一起，于是就用的递归算法。

堆排序：

快速排序：首先须明白什么是划分算法，划分算法就是由两个指针（rightPtr和leftPtr）开始工作，两个指针分别指向数组的两头。取数组中的一个值pivot，进行比较

程序如下：

While（theArray[++leftPtr]<pivot）;

While(theArray[--rightPtr]>pivot);

Swap(leftPtr,rightPtr);

希尔排序：它对于多达几千个数据项的，中等大小规模的数据排序表现良好。希尔排序就相当于增量排序，h=3*h+1;首先用最大的h排序，然后用h=(n-1)/3一步一步的缩小增量。

然而，快速排序在处理非随机性数据时性能不大可靠，因为那时它的速度有可能蜕化至O(N2)级

对于那些有可能是非随机性的数据来说，堆排更加可靠。当快速排序没有被正确的实现时，它会产生微小的偏差。在代码中细小的错误会使它对按某些顺序排列的数据无能为力，而诊断到这种情况却又相当难。

排序	平均情况	最坏情况	比较	附加存储
冒泡排序	O(N²)	O(N²)	及格	不需要
选择排序	O(N²)	O(N²)	良好	不需要
插入排序	O(N²)	O(N²)	优秀	不需要
希尔排序	O(N^3/2)	O(N^3/2)	——	不需要
快速排序	O(N*logN)	O(N²)	优良	不需要
归并排序	O(N*logN)	O(N*logN)	良好	需要
堆排	O(N*logN)	O(N*logN)	良好	不需要

图：

图在数据结构的神殿中与众不同。他们并不存储通用数据，也并不会在其他算法中称为程序员的工具，正相反，它们直接模拟现实世界的情况，图的结构直接反应了问题的结构。

当需要用图时，没有其他的数据结构可以取代之，所以对于何时选择图并没有太多可说的，主要的选择还是如何表示图：使用邻接矩阵或邻接表。这个选择依赖于图的疏密程度，稠密的图用邻接矩阵，稀疏的图用邻接表。

邻接矩阵表示的图的深度优先搜索和广度优先搜索的时间复杂度为O(V²)级,V是顶点的个数，邻接表表示的图的这两种操作的时间复杂度为O(V+E)级，E是边的条数。最小生成树和最短路径在使用邻接矩阵表示时为O(V²)级，邻接表为((E+V)logV)级。请先估计图中的V和E，并通过计算来判断那种表示方法更加合适。