排序的最低时间复杂度为什么是O(nlogn)

这个首先要明确一点,只用到比较的排序算法最低时间复杂度是O(nlogn),而像桶排这样的只需要O(R)(R为桶的大小)
为了证明只用到比较的排序算法最低时间复杂度是O(nlogn),首先要引入决策树。
首先决策树是一颗二叉树,每个节点表示元素之间一组可能的排序,它予以京进行的比较相一致,比较的结果是树的边。
先来说明一些二叉树的性质,令T是深度为d的二叉树,则T最多有2^片树叶。
具有L片树叶的二叉树的深度至少是logL。
所以,对n个元素排序的决策树必然有n!片树叶(因为n个数有n!种不同的大小关系),所以决策树的深度至少是log(n!),即至少需要log(n!)次比较。

log(n!)=logn+log(n-1)+log(n-2)+...+log2+log1
>=logn+log(n-1)+log(n-2)+...+log(n/2)
>=(n/2)log(n/2)
>=(n/2)logn-n/2
=O(nlogn)
所以只用到比较的排序算法最低时间复杂度是O(nlogn)。

 

排序问题的计算复杂性

    对排序算法计算时间的分析可以遵循若干种不同的准则,通常以排序过程所需要的算法步数作为度量,有时也以排序过程中所作的键比较次数作为度量。特别是当作一次键比较需要较长时间,例如,当键是较长的字符串时,常以键比较次数作为排序算法计算时间复杂性的度量。当排序时需要移动记录,且记录都很大时,还应该考虑记录的移动次数。究竟采用哪种度量方法比较合适要根据具体情况而定。在下面的讨论中我们主要考虑用比较的次数作为复杂性的度量。

为了对有n个元素的线性表进行排序,至少必须扫描线性表一遍以获取这n个元素的信息,因此排序问题的计算复杂性下界为Ω(n)

    如果我们对输入的数据不做任何要求,我们所能获得的唯一信息就是各个元素的具体的值,我们仅能通过比较来确定输入序列<a1,a2,..,an>的元素间次序。即给定两个元素ai和aj,通过测试ai<aj ,ai≤aj ,ai=a,ai≥a,ai>a中的哪一个成立来确定ai和aj间的相对次序。这样的排序算法称为比较排序算法。下面我们讨论一下比较排序算法在最坏情况下至少需要多少次比较,即比较排序算法的最坏情况复杂性下界。

我们假设每次比较只测试ai≤a,如果ai≤a成立则ai排在a前面,否则ai排在a后面。任何一个比较排序算法可以描述为一串比较序列:

 (ai,aj),(ak,al),..,(am,an),...

    表示我们首先比较(ai,aj),然后比较(ak,al),...,比较(am,an),...,直到我们获取了足够的信息可以确定所有元素的顺序。显而易见,如果我们对所有的元素两两进行一次比较的话(总共比较了Cn2次),就一定可以确定所有元素的顺序。但是,如果我们运气足够好的话,我们可能不必对所有元素两两进行一次比较。比如说对于有三个元素a1,a2,a3的线性表进行排序,如果我们先比较a1和a2,得到a1≤a2;然后比较a2和a3,得到a2≤a3;则不必比较a1和a3,因为根据偏序集的传递性,必有a1≤a3;但是如果a2≥a3,我们还必须比较a1和a3才能确定a1和a3的相对位置。如果我们适当的安排比较的次序的话,也可以减少比较的次数。这样我们可以用一棵二叉树表示比较的顺序,如下图所示:

    该树的每一个非叶节点表示一次比较,每一根树枝表示一种比较结果,每一个叶节点表示一种排列顺序。这样的一棵二叉树叫做决策树,它用树枝表示了每次决策做出的选择。如此我们可以将任何一个比较排序算法用一棵决策树来表示。

    请注意上图只表明了对三个元素的一种比较算法,这种比较算法依次比较(a1,a2)(a2,a3)(a1,a3),一旦中间某步得到足够的信息就可以停止比较,但是当算法执行完后(三次比较后),一定可以确定三个元素间的次序。因此我们有理由将算法在最坏情况下的比较次数作为算法复杂性的度量,对于本例该算法在最坏情况下要进行C32=3次比较。

显然,一棵决策树中最高叶节点的高度就是该决策树对应的算法在最坏情况下所需的比较次数,而决策树中最低叶节点的高度就是该决策树对应的算法在最好情况下所需的比较次数。

    我们的问题就变为:对于任意一棵决策树(任意一种比较排序算法),它的最高的树叶的高度是多少?这个高度就对应于比较排序算法所需的最多比较次数(在运气最坏的情况下);换句话说,对于任何一个输入,该算法至少需要比较多少次就可以对元素进行排序。

    我们发现,决策树的每个叶节点对应一个n个元素的排列,其中可能有重复的;但是由于决策树表明了所有可能遇到的情况,因而n个元素的所有排列都在决策树中出现过。n个元素共有n!种排列,即决策树的叶节点数目至少为n!。又因为一棵高度为h的二叉树(指二叉树的最高树叶高度为h)的叶节点数目最多为2h个(这时正好是满二叉树,即每个非叶节点都有两个子节点),因此n!≤2h,得到h≥log(n!),其中log以2为底。根据Stirling公式有n!>(n/e)n,于是h>nlogn-nloge,即h=Ω(nlogn)。

这样我们就证明了对于任意一种利用比较来确定元素间相对位置的排序算法,其最坏情况下复杂性为Ω(nlogn)。

    在下文中我们将讨论几种比较排序算法,其中快速排序在平均情况下复杂性为O(nlogn),最坏情况下复杂性为O(n2);堆排序和合并排序在最坏情况下复杂性为O(nlogn),因此堆排序和合并排序是渐进最优的比较排序算法。

    排序算法是否还能够改进呢?从前文我们知道,如果要改进排序算法的效率,就不能只利用比较来确定元素间相对位置。因此我们还需要知道元素的其他附加信息,光知道元素的大小信息是不够的。下文中我们介绍的计数排序,基数排序和桶排序是具有线性时间复杂性的排序算法,这些算法无一例外地对输入数据作了某些附加限制,从而增加已知的信息,因此可以不通过比较来确定元素间的相对位置。

 

 

  • 2
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 时间复杂度最低排序方法是计数排序和桶排序,它们的时间复杂度均为O(n),其中n为待排序元素的个数。这是因为这两种排序方法的基本思想是利用待排序元素的特定信息,将它们分配到不同的桶或计数器中,然后按照特定顺序将它们从桶或计数器中取出来,就可以得到排好序的序列。但是,这两种排序方法需要额外的空间来存储桶或计数器,因此并不适用于所有的排序场景。如果待排序元素的范围较大,需要使用大量的桶或计数器,那么空间复杂度将变得很高。在这种情况下,时间复杂度虽然很低,但空间复杂度较高的快速排序或归并排序排序方法可能更为实用。 ### 回答2: 时间复杂度最低排序方法是基于比较的排序算法中的平均时间复杂度为O(nlogn)的算法,其中最常用的是快速排序和归并排序。 快速排序的基本思想是通过一趟排序将待排序序列分成两个子序列,其中一个序列的所有元素都比另一个序列的小,然后递归地对两个子序列进行排序。快速排序的平均时间复杂度为O(nlogn),其最坏情况下的时间复杂度为O(n^2)。快速排序的一大优势是它的空间复杂度为O(logn),只需要用到递归所需的堆栈空间。 归并排序的基本思想是将待排序序列分成若干个子序列,然后递归地对每个子序列进行排序,最后再将排好序的子序列合并成一个有序序列。归并排序的平均时间复杂度为O(nlogn),其最坏情况下的时间复杂度也为O(nlogn)。归并排序的空间复杂度为O(n),需要额外的空间用于存储合并过程中的临时序列。 总的来说,快速排序和归并排序都是时间复杂度最低排序方法,而在实际应用中,根据具体情况选择合适的排序算法,更多考虑的是排序算法的稳定性、适应性、可行性等因素。 ### 回答3: 时间复杂度最低排序方法是基于比较的排序算法中的快速排序。快速排序是一种分治算法,通过将数组分割为更小的子数组,并通过递归地对子数组进行排序来实现整个数组的排序。 快速排序的基本思想是选择一个元素作为基准值,并将数组中小于基准值的元素放在基准值的左侧,大于基准值的元素放在基准值的右侧。然后再分别对左右两个子数组进行递归调用快速排序算法,直到子数组的长度为1或0时停止递归。最后,将所有子数组的排序结果进行合并,得到最终的有序数组。 快速排序时间复杂度为O(nlogn),其中n是待排序数组的长度。这是因为在每一次递归调用中,快速排序将数组分割成大致相等大小的两个子数组,并对每个子数组进行排序。每次比较的次数为n,递归调用的次数为logn,所以总的比较次数为nlogn。 需要注意的是,在最坏的情况下,快速排序时间复杂度可能达到O(n^2),即当待排序数组已经有序或近似有序时。为了避免这种情况,可采用随机选择基准值或者三数取中法选择基准值,来提高快速排序的性能。 综上所述,快速排序是一种时间复杂度最低排序方法,常用于各种排序场景中。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值