根据许多因素,将列表复制到数组然后使用Quicksort实际上可能更快。
之所以会更快,是因为数组的缓存性能要比链表好得多。如果列表中的节点分散在内存中,则可能是整个地方都生成高速缓存未命中。再说一次,如果数组很大,无论如何都会遇到缓存未命中的情况。
Mergesort可以更好地并行化,因此如果您要这样做,可能是更好的选择。如果直接在链接列表上执行它,则速度也更快。
由于这两种算法都在O(n * log n)中运行,因此要做出明智的决定,就需要在要运行它们的计算机上对它们进行性能分析。
-编辑
我决定检验我的假设,并编写了一个C程序,该程序测量(使用clock())对一个int链接列表进行排序所花费的时间。我尝试了一个分配有每个节点malloc()的链表和一个将节点线性排列在一个数组中的链表,因此缓存性能会更好。我将它们与内置的qsort进行了比较,后者包括将所有内容从碎片列表复制到数组,然后将结果再次复制回去。每种算法都在相同的10个数据集上运行,并对结果取平均值。
结果如下:
N = 1000:
带有合并排序的片段列表:0.000000秒
qsort数组:0.000000秒
合并排序的装箱单:0.000000秒
N = 100000:
具有合并排序的片段列表:0.039000秒
带qsort的数组:0.025000秒
合并排序的装箱单:0.009000秒
N = 1000000:
带有合并排序的片段列表:1.162000秒
带qsort的数组:0.420000秒
合并排序的装箱单:0.112000秒
N = 100000000:
具有合并排序的片段列表:364.797000秒
带qsort的数组:61.166000秒
带合并排序的装箱清单:16.525000秒
结论:
至少在我的机器上,复制到数组中以提高缓存性能非常值得,因为在现实生活中很少有完全打包的链表。应该注意的是,我的机器有一个2.8GHz的Phenom II,但是只有0.6GHz的RAM,因此缓存非常重要。