截至目前,我们分别介绍了两种基础的排序算法。
- 选择排序
- 插入排序
在介绍插入排序时讲到,插入排序的原理是依次交换相邻的元素,适用于元素数量少的情况和数组已经部分有序的情况,而面对大规模乱序数组时,显得力不从心,插入排序会很慢。
针对插入排序的缺点,出现了一种 称为希尔排序的改进算法。
算法定义
希尔排序是为了加快速度简单地改进了插入排序,交换不相邻的元素以对数组的局部进行排序,并最终用插入排序将局部有序的数组排序。
希尔排序的思想是使数组中任意间隔为h的元素都是有序的。这样的数组被称为h有序数组。
换句话说,h有序数组就是h个互相独立的有序数组编织在一起组成的一个数组。
在进行排序时,如果h很大,我们就能将元素移动到很远的地方,为实现更小的h有序创造方便。当h递减为1时,便可实现整个数组排序。这便是希尔排序。
算法实现
实现希尔排序的一种方法是对于每个h,用插入排序将h个子数组独立地排序。但因为子数组是相互独立但,一个更简单的方式是在h-子数组中将每个元素交换到比它大的元素之前区(将比它大的元素向右移动一格)。只需要在 插入排序的代码中,将移动元素的距离由1改为h即可。这样,希尔排序的实现就转为了一个类似于插入排序但使用不同的h间隔进行分组排序的过程。
分析
希尔排序算法更高效的原因是它权衡了子数组的规模和有序性。排序之初,各个子数组都很短,排序之后,子数组都是部分有序的,这两种情况都很适合插入排序。子数组部分有序的程度取决于递增序列的选择。
透彻理解希尔排序的性能至今仍是一项挑战。
算法动图
代码实现(Java)
下面是希尔排序的核心代码,其他辅助函数参见- 选择排序中的代码。
public static void sort(Comparable[] a){
//将a[]升序排列
int N=a.length;
int h=1;
while(h<N/3) h+=h*3+1;//1,4,13,40,121,364,1093,...
while(h>=1){
//将数组变为h有序
for(int i=h;i<N;i++){
//将a[i]插入到a[i-h],a[i-2h],a[i-3h]...之中
for(int j=i;j>=h && less(a[j],a[j-h]);j-=h){
exch(a,j,j-h);
}
}
h=h/3;
}
}