希尔排序原理
希尔排序是对直接插入排序算法的一种改进,二者同属于 插入排序 算法。
我在上一节介绍 直接插入排序 的时候,提到过直接插入排序的几个优点,其中有 当数据已经基本有序时,效率较高。
希尔排序的改进点可以看作是快速使得数据基本有序。
具体如何快速使得数据基本有序呢? 很简单,对原始数据进行 有间隔的直接插入排序。
如下面的动画所示(可以在参考链接中从头观看原始动画),先以 Gap=10对分组数据运行直接插入排序,然后再以Gap=4进行分组直接插入排序,最后Gap=1运行一次直接插入排序。
可以简单分析出以下几点:
(1) 由于直接插入排序复杂度是\(O(n^2)\),因此用Gap分组后,每组的数据量变少,则每组的直接插入排序耗时就会大幅降低;
(2) 不管选用几次Gap,只要最后一次Gap=1,总能完成排序;
(3) 显然,最终的排序耗时是和Gap的选择策略有关的。
下面举一个例子:
(1)第一趟: 选择gap=5,则共得到5组数据(相同颜色为一组),为每一组分别使用直接插入排序;
(2)第二趟:选择gap=2,则共得到2组数据(相同颜色为一组),为每一组分别使用直接插入排序;
(3)第三趟: 选择gap=1,对所有数据使用一次直接插入排序。
希尔排序C++实现
#include <iostream>
using namespace std;
// 希尔排序函数,输入数组data和数据个数n
int shellSort(int data[], int n) {
// 初始化gap为长度一半
int gap = n / 2;
while (gap > 0) {
// 分组直接插入排序
for (int i = 0; i < n - gap; i++) {
int j = i + gap;
int tmp = data[j];
while (j >= gap && tmp < data[j - gap]) {
data[j] = data[j - gap];
j -= gap;
}
data[j] = tmp;
}
if (gap == 2) { //最后一个gap必为1
gap = 1;
} else {
gap /= 2.2;
}
}
return 0;
}
// 打印数组
void printarray(int data[], int n)
{
for (int i=0; i<n; i++)
cout << data[i] << " ";
}
int main()
{
int data[] = {12, 34, 54, 2, 3, 12, 27, 1};
int n = 8;
cout << "data before shell sorting: \n";
printarray(data, n);
shellSort(data, n);
cout << "\ndata after shell sorting: \n";
printarray(data, n);
return 0;
}
希尔排序gap选择策略
希尔排序的复杂度和gap序列的选择息息相关,下面先贴出一个WIKI的不同选择策略的对比图。(其中有些gap序列从1开始是为了逆序排序)
未完待续。。。
参考资料:
(1) WIKI: https://en.wikipedia.org/wiki/Shellsort
(2) 动画出处: http://www.programming-algorithms.net/article/41653/Shell-sort