希尔排序
希尔排序是基于插入排序的以下两点性质而提出改进方法的:
- 插入排序在对几乎已经排好序的数据操作时,效率高,即可以达到线性排序的效率。
- 但插入排序一般来说是低效的,因为插入排序每次只能将数据移动一位。
基本思想
该方法实质上是一种分组插入方法:
比较相隔较远距离(称为增量)的数,使得数移动时能跨过多个元素,则进行一次比较就可能消除多个元素交换;算法先将要排序的一组数按某个增量d分成若干组,每组中记录的下标相差d,对每组中全部元素进行排序,然后再用一个较小的增量对它进行,在每组中再进行排序;当增量减到1时,整个要排序的数被分成一组,排序完成;一般的初次取序列的一半为增量,以后每次减半,直到增量为1。
我们来看代码:
void ShellSort(int *array, int size)
{
//int gap = 3;
//int gap = gap / 3 + 1;这个方式较优
int gap = size;
while (gap > 1)
{
int i = 0;
gap = gap / 3 + 1;
for (i = gap; i < size; ++i)
{
int key = array[i];
int end = i - gap;
//找待插入元素的位置,搬移元素
while (end >= 0 && key < array[end])
{
array[end + gap] = array[end];
end -= gap;
}
//插入数据
array[end + gap] = key;
}
//gap--;
//gap /= 2;
}
}
再看看实现过程:
稳定性分析
由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。
性能分析
希尔排序的时间性能优于直接插入排序的原因:
- 当文件初态基本有序时直接插入排序所需的比较和移动次数均较少。
- 当n值较小时,n和n²的差别也较小,即直接插入排序的最好时间复杂度O(n)和最坏时间复杂度0(n²)差别不大。
- 在希尔排序开始时增量较大,分组较多,每组的记录数目少,故各组内直接插入较快,后来增量di逐渐缩小,分组数逐渐减少,而各组的记录数目逐渐增多,但由于已经按di-1作为距离排过序,使文件较接近于有序状态,所以新的一趟排序过程也较快。
- 希尔排序是按照不同步长对元素进行插入排序,当刚开始元素很无序的时候,步长最大,所以插入排序的元素个数很少,速度很快;当元素基本有序了,步长很小,插入排序对于有序的序列效率很高;所以,希尔排序的时间复杂度会比o(n^2)好一些。
实现代码块
//希尔排序
void ShellSort(int *array, int size)
{
//int gap = 3;
//int gap = gap / 3 + 1;这个方式较优
int gap = size;
while (gap > 1)
{
int i = 0;
gap = gap / 3 + 1;
for (i = gap; i < size; ++i)
{
int key = array[i];
int end = i - gap;
//找待插入元素的位置,搬移元素
while (end >= 0 && key < array[end])
{
array[end + gap] = array[end];
end -= gap;
}
//插入数据
array[end + gap] = key;
}
//gap--;
//gap /= 2;
}
}
//打印函数
void PrintArray(int *array, int size)
{
int i = 0;
for (; i < size; i++)
{
printf("%d ", array[i]);
}
printf("\n");
}
//测试函数
void TestSort()
{
int array[] = { 2, 0, 4, 9, 3, 6, 8, 7, 1, 5 };
PrintArray(array, sizeof(array) / sizeof(array[0]));
ShellSort(array, sizeof(array) / sizeof(array[0]));
PrintArray(array, sizeof(array) / sizeof(array[0]));
}
int main()
{
TestSort();
system("pause");
return 0;
}
运行结果: