5 排序
5.1 冒泡排序
5.2 选择排序
5.3 插入排序
5.4 希尔排序
希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。 希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。
一句话总结:
插入排序每次是比较左相邻元素,然后决定是否前移一个单位;
希尔排序是假定间隔为gap,第一组第一个元素为索引0,第二组第一个元素索引为1,……,每一组内元素的原索引相隔为gap,然后在每一小组内进行插入排序;改变间隔gap,继续对每一组进行插入排序,直至最后gap为1,即最后一次执行的是插入排序
如下图所示,当gap=4时,原来的一组数据分为四组数据,分别对四组子序列进行插入排序。重复这过程,不过每次缩减gap来进行。最后gap=1时就只有一个序列进行插入排序。
希尔排序分析
插入排序的核心代码是:
if alist[i] < alist[i-1]:
alist[i-1],alist[i] = alist[i], alist[i-1]
希尔排序中,每次比较的两个元素不再是左邻元素,而是左边间隔gap的元素,因此核心代码应该是:
if alist[i] < alist[i-gap]:
alist[i-gap],alist[i] = alist[i], alist[i-gap]
那么
i
i
i应该从多少取到多少呢?
因为最小索引为0,所以必须满足 i - gap >= 0
,那么 i >= gap
,而每次i取值后,需要和前面所有间隔为gap的元素进行比较,所以每轮插入排序循环中i要依次减少gap,直到 i - gap 小于0 的 i 值,这样才把一个子序列比较完;
所以核心代码加上控制 i 依次减 gap 的外层循环条件后为:
for i in range(?,0,-gap):
if alist[i] < alist[i-gap]:
alist[i-gap],alist[i] = alist[i], alist[i-gap]
else:
break
如下图所示,相当于把所有的子序列分为前后两部分,因插入排序是将后面的元素和前面的元素相比,所以后面部分的最小索引为gap,最大索引为n-1,故 i 的取值为 [gap,n-1]
因此 ,在外侧还得添加一个循环,使得 i 从一个序列跳到 下一个序列,即让 i +1,那么i从上一轮起始的77 变成新一轮的 31
for j in range(gap,n):
for i in range(j,0,-gap):
if alist[i] < alist[i-gap]:
alist[i-gap],alist[i] = alist[i], alist[i-gap]
else:
break
除此之外,gap每次还要改变,这里假定每次取一半。
分析结束。
实现代码
写法一:
def shell_sort(alist):
n = len(alist)
gap = n // 2
for j in range(gap,n):
for i in range(j,0,-gap):
if alist[i] < alist[i-gap]:
alist[i-gap],alist[i] = alist[i], alist[i-gap]
else:
break
写法二:
def shell_sort(alist):
n = len(alist)
gap = n // 2
# gap变化到0之前,插入算法执行的次数
while gap > 0:
# 插入算法,与普通的插入算法的区别就是gap步长
for j in range(gap, n):
# j = [gap, gap+1, gap+2, gap+3, ..., n-1]
i = j
while i > 0:
if alist[i] < alist[i-gap]:
alist[i], alist[i-gap] = alist[i-gap], alist[i]
i -= gap
else:
break
# 缩短gap步长
gap //= 2
测试:
alist = [54,226,93,17,77,31,44,55,20]
shell_sort(alist)
print(alist)
[17, 20, 31, 44, 54, 55, 77, 93, 226]
时间复杂度
最优时间复杂度:根据步长序列的不同而不同
最坏时间复杂度:
O
(
n
2
)
O(n^2)
O(n2) (当gap= 1时)
稳定性:不稳定