9.7 各种排序方法的选择和使用
- 这些排序方法方法各有其优缺点,各有其适用的情况,无法笼统地说哪种方法最好,只能说在某种情况下哪种方法更适用。因此,在实际应用中,应根据不同的情况选择不同的算法。在选择排序方法时,主要需考虑以下因素。
1)数据表的大小,即待排序数据元素的个数。
2)关键字的分布情况。
3)对排序的稳定性要求。
- 考虑上述因素,在此提出下列建议供参考。
1)若数据表的长度较小(如n<50)时,可采用简单的排序方法(如直接插入排序或选择排序)。但要注意插入排序的数据元素移动次数比选择排的次数多,因此,当数据元素个数较多时,用选择排序较好。
2)若数据表的长度较大时,应选用执行时间与 nlog2n 成正比的排序方法,如快速排序、希尔排、堆排序和归并排序等。
当数据表中数据元素的关键字分布随机时,
- 快速排序的平均运行时间最少;
- 堆排序只需一个记录的辅助空间,并且不会出现快速排序可能出现的最坏情况;
- 希尔排序由于也是一种插入排序,故排序过程中移动记录的次数较多,但当记录接近有时,希尔排较快。
- 上述三种排序方法都是不稳定的。
- 利用归并排序可满足对排序结果稳定性的要求。
- 还可将归并排序与直接插入排序联合使用,即先用直接插入排序得到长度小于50的有序段,然后再两两归并。
3)若待排序记录已基本有序,可采用插入类排序方法或冒泡排序。
4)当n很大而关键字位数较小时,可考虑采用基数排序方法。
- 前面讨论的排序算法基本上都是在一维数组上实现的,当记录本身信息量较大时,为了避免浪费大量时间移动记录,可以用链表作为存储结构,如插入排序和归并排序都易于在链表上实现;但有的方法,如快速排序和堆排序,在链表上难于实现,在这种情况下,可以提取关键字建立索引表,然后,对索引表进行排序。然而更为简单的方法是:引入一个整形向量作为辅助表。