希尔排序(Shell's Sort)是插入排序的一种又称“缩小增量排序”(Diminishing Increment Sort),是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。
先取一个小于n的整数d1作为第一个增量,把文件的全部记录分组。所有距离为d1的倍数的记录放在同一个组中。先在各组内进行直接插入排序;然后,取第二个增量d2<d1重复上述的分组和排序,直至所取的增量等于1,即所有记录放在同一组中进行直接插入排序为止。该方法实质上是一种分组插入方法。一般的初次取序列的一半为增量,以后每次减半,直到增量为1。
由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。
希尔排序的时间复杂度与增量序列的选取有关。希尔排序时间复杂度的下界是n*log2n。希尔排序没有快速排序算法快 O(n(logn))。中等大小规模表现良好,对规模非常大的数据排序不是最优选择。但是比O( )复杂度的算法快得多。希尔算法在最坏的情况下和平均情况下执行效率相差不是很多,与此同时快速排序在最坏的情况下执行的效率会非常差。几乎任何排序工作在开始时都可以用希尔排序,若在实际使用中证明它不够快,再改成快速排序这样更高级的排序算法. 本质上讲,希尔排序算法是直接插入排序算法的一种改进,减少了其复制的次数,速度要快很多。原因是,当n值很大时数据项每一趟排序需要移动的个数很少,但数据项的距离很长。当n值减小时每一趟需要移动的数据增多,此时已经接近于它们排序后的最终位置。正是这两种情况的结合才使希尔排序效率比插入排序高很多。时间复杂度O(n^(1.3—2)),空间复杂度O(1)。
在希尔排序中希尔给出了一组增量序列:ht = N / 2, h[k] = h[k+1] / 2,即{N/2, (N / 2)/2, ..., 1},这个序列就叫做希尔增量。这个是编写希尔排序时最常用的序列,但却不是最好的。其余的增量序列还有Hibbard:{1, 3, ..., 2^k-1},Sedgewick:{1, 5, 19, 41, 109...}该序列中的项或者是9*4^i - 9*2^i + 1或者是4^i - 3*2^i + 1。使用不同的增量对希尔排序的时间复杂度的改进将不一样,甚至一点小的改变都将引起算法性能剧烈的改 [1] 变。
#include<stdio.h>
#include<math.h>
/*
* 根据当前增量进行插入排序
* n:待排数组长度
* dk:Hibbard增量
* */
void shellInsert(int array[], int n, int dk) {
int i,j,temp;
for(i=dk;i<n;i++) {//分别向每组的有序区域插入,这里i不从0开始,从dk开始,
temp=array[i];
for(j=i-dk;(j>=i%dk)&&array[j]>temp;j-=dk)//比较与记录后移同时进行
array[j+dk]=array[j];
if(j!=i-dk)
array[j+dk]=temp;//插入
}
}
//计算Hibbard增量,{1, 3, ..., 2^k-1}
int dkHibbard(int t,int k) {
return (int)(pow(2,t-k+1)-1);
}
//希尔排序
void shellSort(int array[],int n,int t) {
for(int i=1;i<=t;i++)
shellInsert(array,n,dkHibbard(t,i));
}
//此写法便于理解,实际应用时应将上述三个函数写成一个函数。
int main() {
int arr[] = {1, 5, 3, 6, 10, 55, 9, 2, 87, 12, 34, 75, 33, 47};
int size = sizeof(arr) / sizeof(int);
shellSort(arr,size, (int)(log(size+1)/log(2))); //排序趟数应为log2(n+1)的整数部分
for(int i=0;i<size;i++)
printf("%d ",arr[i]);
printf("\n");
return 0;
}