什么是希尔排序
希尔排序的本质是插入排序的一种改进,它通过比较相距一定间隔的元素来工作,比较的距离随着个算法的工作而逐渐减小,一直到元素距离为1的一轮比较结束为止,正是因为由于这份原因,希尔排序又被叫做减小增量的排序。
上面我提到希尔排序是插入排序的一种改进,所谓插入排序就是将一个无序的数组A中的数据根据数组下标一个个的插入到另一个数组B中,并且每次插入之前都会通过比较和后移已经插入的元素的方式,帮助待插入数组找到一个合适的位置的排序方法。
由于插入排序的每一次嵌套循环都会花费N次迭代,因此插入排序的时间复杂度为O(N2),并且插入排序适合小数据量的排序,如果待排序数据量非常庞大,并且完全无序,那么在这个时候选择插入排序就是一种非常愚蠢的选择。
也正是由于上面的原因,一种基于插入排序的改进算法诞生了,那就是希尔排序!
希尔排序的原理
如上图中有一个拥有10个元素的无序序列,然后我们根据这个数组的长度来计算它一轮排序的元素距离: int gap = array.lenght/2
gap就是待比较元素的距离,因为实例中的数组一共有10个元素,所以它第一轮排序的步长就是5.
所以就可以得到数组的第一次分组:{arr[0],arr[5]},{arr[1],arr[6]}{arr[2],arr[7]}{arr[3],arr[8]}{arr[4],arr[10]}。
所以第一次比较就是arr[0]=5,arr[5]=4,因为4小于5,arr[0]中的元素就移动到arr[5]当中,而4就放在arr[0],这就完成了第一插入排序,后面的排序同理可得,最后得到当元素间隔为5师,数组排序结果如下图所示:
不难看出经过一轮排序,已经将数组中较大的元素都放到了后面,较小的元素则移动到了前面。
下面是第二轮排序,比较数据的间隔为:gap=5/2=2
这时整个数组就有了以下分组:
{arr[0],arr[2],arr[4],arr[8,arr[10]]} (数组下标均间隔2)
{arr[1],arr[3],arr[5],arr[7],arr[9]} (数组下标均间隔2)
然后我们要做的就是对上面两个进行插入排序:
第一组数据:arr[0],arr[2],arr[4],arr[8,arr[10]]
先令tmp = arr[2]
arr[2]与arr[0],如果tmp小于arr[0],则arr[0]=arr[2],arr[0]=tmp,反之则不动
再令tmp = arr[4]
则如果tmp小于arr[4-gap]即与arr[2]比较,则arr[4]=arr[4-gap],再接着如果tmp小于arr[4-2*gap]即与arr[0],则arr[4-2*gap],后面数据以此类推:
最后得到中间数组:
再接着就是最后一轮插入排序,与上述同理的gap=2/2=1,即各自与前面的数据比较,小则移动数据。
最后得出排序结果:
下面贴上希尔排序的代码:
public static void sort2(int arr[]){
int length = arr.length;
int j;
for (int gap = length/2;gap>0;gap/=2){
for (int i=gap;gap<length;i++){
int tmp = arr[i];
for (j=i;j>=gap&&tmp<arr[j-gap];j-=gap){
arr[j]=arr[j-gap];
}
arr[j]=tmp;
}
}
}