希尔排序是基于插入排序的一个优化。可以使平均时间复杂度减少为O(n * log2(n))。
例题
洛谷1177 排序
题目描述
将读入的 N 个数从小到大排序后输出。
输入格式
第 1 行为一个正整数 N。
第 2 行包含 N 个空格隔开的正整数 a[i],为你需要进行排序的数,数据保证了a[i]不超过10^9。
输出格式
将给定的 N个数从小到大输出,数之间用空格隔开。
输入输出样例
输入
5
4 2 4 5 1
输出
1 2 4 4 5
说明提示
对于20% 的数据,有 N <= 10^3。
对于100% 的数据,有 N <=10^5 。
希尔排序
这里我们定义一个新的变量gap表示增量,意思是每次将a[1] ~ a[n] 分为gap组:
第1组:a[1],a[gap + 1],a[2 * gap + 1] ……
第2组:a[2],a[gap + 2],a[2 * gap + 2] ……
第3组:a[3],a[gap + 3],a[2 * gap + 3] ……
……………………………………………………
第gap组:a[gap],a[gap + gap],a[2 * gap + gap] ……
之后分别对这gap组进行插入排序,就可以让序列中变得比之前更加有序。
gap刚开始往往取(n / 2),之后每次让gap /= 2,直到gap == 0了就停止。这里可能相对来说比较难理解,你可以自己动手去分析一下样例。
最后算一下这个算法的时间复杂度:我们需要先枚举gap,再去枚举i和j,总共有三重循环。第一重循环每次是gap /= 2,跑了大约log2(n)次,而第二重循环跑了大约n次。但第三重循环实际上很快,常数次就跑完了,因为每次分完组,都会使这个序列变得更加有序,第三重循环去插入的时候跑了几次就跳出去了。所以综合起来平均的时间复杂度也就O(n * log2(n))级别,相对于插入排序就快了很多了。
这里有一个坑点务必注意:在写j这个循环时,判断是否跳出循环的语句中一定要把j >= 1 放在a[j] > a[j + gap]前面。
for