前言
话接上回(排序算法之——简单排序(冒泡、插入))
实际上,这两种算法的效率在所有排序算法里,可以说是最LOW的(O(n^2))但由于这两种算法适用于链表的使用背景,所以存在了下来,但对数组来说,我们不建议使用原始的简单排序,但有一种经过改进的插入排序方法,在数组中使用却较大提高了排序效率,那就是——希尔排序
百度百科这样说:
(Shell排序)不需要大量的辅助空间,和归并排序一样容易实现。
希尔排序是基于插入排序的一种算法, 在此算法基础之上增加
了一个新的特性,
提高了效率。希尔排序的时间的时间复杂度为O( ),希尔排序
时间复杂度的下界是 n*log2n。希尔排序没有快速排序算法快
O(n(logn)),因此中等大小规模表现良好,
对规模非常大的数据排序不是最优选择。但是比O( )复杂度
的算法快得多。
并且希尔排序非常容易实现,算法代码短而简单。
此外,希尔算法在最坏的情况下和平均情况下执行效率相差不是很多
,与此同时快速排序在最坏的情况下执行的效率会非常差。
专家们提倡,几乎任何排序工作在开始时都可以用希尔排序,
若在实际使用中证明它不够快,再改成快速排序这样更高级的
排序算法. 本质上讲,希尔排序算法是直接插入排序算法的一种改进,
减少了其复制的次数,速度要快很多。 原因是,当n值很大时数据项
每一趟排序需要移动的个数很少,但数据项的距离很长。
当n值减小时每一趟需要移动的数据增多,此时已经接近于
它们排序后的最终位置。 正是这两种情况的结合才使希尔排序效率
比插入排序高很多。Shell算法的性能与所选取的分组长度序列
有很大关系。只对特定的待排序记录序列,可以准确地估算关键词
的比较次数和对象移动次数。想要弄清关键词比较次数和记录移动次数
与增量选择之间的关系,并给出完整的数学分析,今仍然是数学难题。
数学原理
增加每次插入排序交换的逆序对数
方法
那如何增加呢?——增加插入排序的比较间隔不就好啦!
这样的方法可以保证几乎每次插入消除更多逆序对,但不能保证数组完全有序。故需要将间隔缩小到1,以保证所有数两两有序。
由于插入间隔缩小后的排序不会打乱上次大间隔的排序
(不信你试试啊[doge]),所以我们可以放心缩小间隔,
那么问题来了,什么样的间隔才能最大化希尔排序的效率呢?
Hibbard增量序列、Knuth增量序列、Sedgewick增量序列(来自大佬的博客)
数学原理我就不讲了(其实是不会 )
代码
光说不做假把式,上代码
#include <iostream>
#include <cstdio>
#include <vector>
#include <queue>
typedef int ElementType;
using namespace std;
long *A;
int N;
void Shell_Sort()
{
int Si,D,P,i;
int Tmp;
int Sedgewick[]={929,505,209,109,41,19,5,1,0};//Sedgewick序列
for(Si=0;Sedgewick[Si]>=N;Si++);
for(D=Sedgewick[Si];D>0;D=Sedgewick[++Si])//每次都更新边界
{//然后略改插入排序代码即可
for(P=D;P<N;P++)
{
Tmp=A[P];
for(i=P;i>=D&&A[i-D]>Tmp;i-=D)
{
A[i]=A[i-D];
}
A[i]=Tmp;
}
}
}
int main()
{
cin>>N;
A=(long *)malloc(sizeof(long)*N);
for(int i=0;i<N;i++)
{
cin>>A[i];
}
Shell_Sort();
for(int i=0;i<N;i++)
{
cout<<A[i]<<" ";
}
system("pause");
return 0;
}
P.S.虽然希尔排序相较于插入排序改进了不少,但依然不是最快的排序方法,下篇文章将会介绍名副其实的——快速排序。