【面试】解释为什么快速排序算法通常被认为比归并排序算法更好

Lewiz_124

于 2024-08-09 19:23:20 发布

阅读量1k

点赞数 28

分类专栏： # 数据结构面试文章标签：排序算法面试算法

本文链接：https://blog.csdn.net/Lewiz_124/article/details/141069674

版权

13 篇文章 0 订阅

订阅专栏

面试官: 你能解释一下为什么快速排序算法通常被认为比归并排序算法更好吗？

快速排序（Quicksort）：

归并排序（Mergesort）：

平均时间复杂度： $\log n)$
最坏时间复杂度： $\log n)$
最佳时间复杂度： $\log n)$
主要特点： 归并排序的时间复杂度在最坏情况下也是 $\log n)$ ，这是因为它的分治策略不会受到输入数据分布的影响，因此在非常大、分布复杂的数据集上，它的表现非常稳定。

总结：

虽然归并排序的最坏时间复杂度是 $\log n)$ ，而快速排序的最坏情况是 $O(n^2)$ ，但快速排序的平均性能通常更好。这是因为快速排序通常只需要在内存中操作，并且其内循环非常高效。此外，最坏情况 $O(n^2)$ 可以通过随机化或优化基准选择来避免。

快速排序：

归并排序：

总结：

快速排序的局部性：

分区过程： 快速排序通过选择一个基准（pivot），然后对数组进行划分，将小于基准的元素放在基准左边，大于基准的元素放在右边。这个分区操作是在数组内部完成的，访问模式通常是连续的线性扫描，符合空间局部性原则。
递归处理： 快速排序通过递归地对分区的子数组进行排序，每次递归只处理一个子数组。由于每次递归都集中在数组的一个子区间内，因此访问模式也表现出良好的空间局部性。特别是在深层递归时，处理的数组区间越来越小，数据往往能在CPU缓存中保持，减少了内存访问的开销。

快速排序的缓存性能：

缓存友好： 由于快速排序的分区操作和递归过程大多集中在数组的连续区间内进行，因此数据在内存中的访问模式非常适合缓存的使用。缓存可以存储这些被频繁访问的局部数据，减少了缓存未命中率，从而提高了整体性能。
子数组处理： 当递归深入到较小的子数组时，这些小子数组通常可以完全装入缓存中，从而使得这些递归调用的内存访问几乎完全在缓存中完成，进一步提升了效率。

例子：

假设我们有一个长度为1000的数组，当快速排序在处理第一个子数组（假设长度为500）时，它将连续扫描这500个元素。接着处理第二个子数组时，同样会扫描剩下的500个元素。由于这些操作都是连续的线性扫描，内存访问非常高效。

归并排序：

分割和合并： 归并排序在执行时会将数组分割成多个小块，然后将这些小块递归地排序并合并。尽管分割过程对局部性影响不大，但合并过程需要将数据从不同的内存位置读取并写入临时数组，这种非连续的内存访问模式可能导致较差的缓存性能。
额外的内存使用： 归并排序在合并阶段需要使用额外的内存来存储中间结果，频繁的数据移动和复制可能会增加缓存未命中的概率，降低整体效率。

总结：

快速排序的分区和递归操作主要集中在数组的局部区域，数据访问具有较好的空间局部性，并且递归处理的子数组逐渐变小，使得它能更好地利用缓存，提高缓存命中率。相比之下，归并排序由于频繁的非连续内存访问和额外的内存使用，缓存性能较差。

时间复杂度和性能： 快速排序的平均时间复杂度是 $\log n)$ ，且通常比归并排序在实际应用中表现更好，尽管最坏情况下时间复杂度为 $O(n^2)$ ，但可以通过优化来避免。
空间复杂度： 快速排序是就地排序算法，空间复杂度为 $O(\log n)$ ，而归并排序需要 $O (n)$ 的额外空间。
缓存性能： 快速排序具有更好的缓存友好性和内存局部性，在处理大数据集时表现更优。