0) 引论
希尔排序时Donald Shell于1959年发明的一种改进插入排序的排序算法。对于插入排序我们知道,要想打破插入排序的时间界,那么必须要交换向距离比较远的元素。希尔排序通过引入增量序列,首先排序距离较远的元素,大大缩小逆序的数量,进而提高了插入排序的执行效率。
1) 希尔排序
希尔排序利用一个增量序列,h1,h2,...,ht,任何增量序列只需要满足h1=1即可。在使用增量hk的排序中,只需要要满足A[i]<=A[i+hk]即可。也就是说使距离为hk的数据是有序的。希尔排序利用的原理就是首先交换距离较远的元素,减小逆序的数目。下面是一个小例子。
void Shellsort(ElementType A[], int N)
{
int i,j,Increment;
ElementType Tmp;
for(Increment=N/2;Increment>0;Increment /=2)
for(i=Increment;i<N;i++)
{
Tmp = A[i];
for(j=i;j>=Increment;j-=Increment)
{
if(Tmp<A[j-Increment])
A[j] = A[j-Increment];
else
break;
}
A[j] = Tmp;
}
}
这个代码只是对插入排序的代码进行了一点修改,就是加入了增量序列的循环,同时首先交换距离较远的元素。而不是每次交换临近元素。
关于希尔排序的一个比较主要的问题就是增量序列的选择问题。亦即是增量最大值ht,增量间距hk的选择问题。一个比较流行但是并不好的方法是:
希尔排序的增量序列的选择不同,算法的效率也会不一样。
Hibbard提出了一种增量序列1,3,7,...2^k-1.
2) 总结
希尔排序通过引入增量序列,优先交换距离远的数据,减小逆序的个数,使排序时间缩短。
希尔排序简单,相对于插入排序高效,即使对于比较大的数据集也能取得比较不错的结果。