1. 数据结构和算法(十七)希尔排序算法
1.1 什么是希尔排序
- 希尔排序是希尔(Donald Shell)于1959年提出的一种排序算法。希尔排序也是一种希尔排序,它是简单希尔排序经过改进之后的一个更高效的版本,也称为缩小增量排序。
1.2 算法基本思想
希尔排序是把记录按下标的一定增量分组,对每组使用直接希尔排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。
简单希尔排序很循规蹈矩,不管数组分布是怎么样的,依然一步一步的对元素进行比较,移动,插入,比如[5,4,3,2,1,0]这种倒序序列,数组末端的0要回到首位置很是费劲,比较和移动元素均需n-1次。而希尔排序在数组中采用跳跃式分组的策略,通过某个增量将数组元素划分为若干组,然后分组进行希尔排序,随后逐步缩小增量,继续按组进行希尔排序操作,直至增量为1。希尔排序通过这种策略使得整个数组在初始阶段达到从宏观上看基本有序,小的基本在前,大的基本在后。然后缩小增量,到增量为1时,其实多数情况下只需微调即可,不会涉及过多的数据移动。
我们来看下希尔排序的基本步骤,在此我们选择增量gap=length/2,缩小增量继续以gap = gap/2的方式,这种增量选择我们可以用一个序列来表示,{n/2,(n/2)/2…1},称为增量序列。希尔排序的增量序列的选择与证明是个数学难题,我们选择的这个增量序列是比较常用的,也是希尔建议的增量,称为希尔增量,但其实这个增量序列不是最优的。此处我们做示例使用希尔增量。
图片来源网上(侵删)
1.3 希尔排序复杂度分析
希尔排序的时间复杂度是 :希尔排序复杂度分析非常复杂,不同gap序列的设计对应不同的复杂度
- 最坏时间复杂度:根据步长序列的不同而不同。已知最好的: O(n (logn) ^2)
- 最优时间复杂度:O(n)
- 平均时间复杂度:根据步长序列的不同而不同。
- 最坏空间复杂度:O(n)
1.4 希尔排序代码实现
package com.yuanxw.datastructure.chapter17;
import java.util.Arrays;
/**
* 希尔排序
* 希尔排序是一种基于插入排序的算法,相较于插入排序一点一点的移动元素,希尔排序实现了快速移动一大步