首先,我们要知道,插入排序的数据规模越小,或者越接近有序,他的效率是越高的。
基于这个结论,希尔改进了插入排序,创造了希尔排序。【希尔排序是插入排序的一种,也叫做缩小增量排序】
具体改进如下: 先将序列在逻辑上分组,分组靠的是增量。因为分组导致每个小组的数据规模较小,所以插入排序效率高;当此次分组的排序结束后,减小增量,此时每个组的数据规模会增加,但是因为有小分组排序的铺垫,这新的分组有序性会很高,插入排序效率也很高。所以完美的利用分组把插入排序的优势展现出来,当增量变为1的时候,数组就排好序了。
带注释的代码:
void shellInsertSort(vector<int>& arr, int start,int gap) {
//插入排序思路,只不过间隔为gap
int n = arr.size();
//插入排序:循环的开始为无序表的第一个元素位置,即数组中第二个元素的位置,因为通常将第一个元素看作有序表的最后一个元素,遍历到数组的结尾
for (int j = start + gap; j < n; j += gap) {//无序表的第一个元素开始,向后遍历,间隔为gap
int i = j - gap;//有序表的最后一个元素的位置
int tmp = arr[j];//临时变量tmp为当前要排序的无序表的元素
while (i >= start&&tmp < arr[i]) {//如果tmp<有序表的最后一个元素,则在有序表中插入该元素,并将有序表最后一个元素开始向后移动
//把有序表的最后一个元素赋值给无序表的第一个元素,然后有序表向前移动
arr[i + gap] = arr[i];
i -= gap;
}
arr[i + gap] = tmp; //如果tmp>有序表的最后一个元素,则放在有序表最后一个元素的后面
}
}
void shellSort(vector<int> &arr) {
int n = arr.size();
for (int gap = n / 2; gap >= 1; gap = gap / 2) {//每次都重新进行分组
for (int i = 0; i < gap; i++) {//对每一组数据进行直接插入排序,直到间距为1
shellInsertSort(arr, i, gap);//参数依次为:要操作的数组、开始元素的下标、元素间的增量
}
}
}
不带注释的完整代码,大体一样,不带注释的是作者拿vs按照思路又重敲的
#include<iostream>
#include<vector>
using namespace std;
void shellinsertSort(vector<int>& arr, int start, int gap) {
int n = arr.size();
for (int j = start + gap; j < n; j += gap) {
int i = j - gap;
int tmp = arr[j];
while (i >= start && arr[i] > tmp) {
arr[i + gap] = arr[i];
i -= gap;
}
arr[i + gap] = tmp;
}
}
void shell(vector<int>& arr) {
int n = arr.size();
if (n <= 1) {
return;
}
for (int gap = n / 2; gap >= 1; gap = gap / 2) {
for (int i = 0; i < gap; i++) {
shellinsertSort(arr, i, gap);
}
}
}
void printArr(vector<int>& arr) {
int n = arr.size();
for (int i = 0; i < n; i++) {
cout << arr[i] << " ";
}
cout << endl;
}
int main() {
vector<int> arr = { 7,9,4,9,8,5 };
shell(arr);
printArr(arr);
return 0;
}
shell排序的时间复杂度:
shell排序的时间复杂度是根据选中的 增量d 有关的,所以分析shell排序的时间复杂度是个比较麻烦的事;这里只给出答案,不推算了;
在最优的情况下,时间复杂度为:O(n ^ (1.3) ) (元素已经排序好顺序)
在最差的情况下,时间复杂度为:O(n ^ 2);
空间复杂度:
不需要额外的空间占用,所以为O(1)。
稳定性:
插入排序是稳定的,但是分组之后再插入排序的希尔排序是不稳定。