一.插入排序
1.插入排序的基本思想:
**把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为
止,得到一个新的有序序列 。 **
2.例子:
4,5,6,3,2,1
将首元素4作为一个有序区间,将后面的第一个元素5,插入到4这个有序区间里,依次往前比较直到插入到前面的数比5小,后面的数比5大为止。然后将后面的数依次插入到前面的有序区间里,这就是插入排序。
3.插入排序源码
// 插入排序
void InsertSort(int* a, int n)
{
assert(a);
for (int i = 0;i < n-1;i++)
{
int end = i;
int tmp = a[end + 1];
while (end >= 0)
{
if (tmp < a[end])
{
a[end + 1] = a[end];
end--;
}
else
{
break;
}
}
a[end + 1] = tmp;
}
}
4.插入排序总结:
- 元素集合越接近有序,直接插入排序算法的时间效率越高
- 时间复杂度:O(N^2)
- 空间复杂度:O(1),它是一种稳定的排序算法
- 稳定性:稳定
二.希尔排序
1.希尔排序的思想:
希尔排序法又称缩小增量法。希尔排序法的基本思想是:先选定一个整数,把待排序文件中所有记录分成个
组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工
作。当到达=1时,所有记录在统一组内排好序。
2.例子:
希尔排序是对插入排序的优化,在对数据进行插入排序之前进行了预排序(也就是gap>1的情况),当gap向1趋近,数据也自然向有序趋近,gap == 1的时候就是对数据进行插入排序。元素集合越接近有序,直接插入排序算法的时间效率越高,所以通过预排序使得插入排序的效率有了显著的提高
3.希尔排序源码:
// 希尔排序
void ShellSort(int* a, int n)
{
assert(a);
int gap = n;
while (gap > 1)
{
gap = gap/3+1;
for (int i = 0;i < n - gap;i++)
{
int end = i;
int tmp = a[end + gap];
while (end >= 0)
{
if (tmp < a[end])
{
a[end + gap] = a[end];
end -= gap;
}
else
{
break;
}
}
a[end + gap] = tmp;
}
}
}
4.希尔排序总结:
-
希尔排序是对直接插入排序的优化。
-
当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时(此时进行直接插入排序),数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比。
-
希尔排序的时间复杂度 :由于gap的取值方法是不固定的,所以时间复杂度也是不固定的,本文的希尔排序采用的是Knuth提出的gap取值方法,因此时间复杂度是O(N^1.25) ~O(1.65*N^1.25)。
-
稳定性:不稳定 (例子:5 8 5 2 9)
三.选择排序
1.选择排序的思想:
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的
数据元素排完 。
2.例子(升序排序):
5,4,3,2,1,6
第一趟选出最小1,和首元素进行交换,第二趟选出除首元素外最小的2,和第二个元素进行交换,依次进行,直到元素集合整体变为升序区间。
3.直接排序源码:
我们还可以在选择排序的基础上进行优化,每趟排序选出最小值和最大值,将最小值放到最左边,最大值放到最右边,类似二分法,这样就减少了循环的次数。但当maxi和begin重合时,我们先进行的是mini和begin交换,所以交换完begin是最小值,而不是最大值了(最大值已经换到mini),所以我们要进行调整,将maxi的下标改为mini
void Swap(int* e1, int* e2)
{
int tmp = *e1;
*e1 = *e2;
*e2 = tmp;
}
// 选择排序
void SelectSort(int* a, int n)
{
assert(a);
int begin = 0;
int end = n - 1;
while (begin < end)
{
int mini = begin;
int maxi = begin;
for (int i = begin + 1;i < end;i++)
{
if (a[i] < a[mini])
mini = i;
if (a[i] > a[maxi])
maxi = i;
}
Swap(&a[begin], &a[mini]);
// 如果begin和maxi重叠,那么要修正一下maxi的位置
if (begin == maxi)
{
maxi = mini;
}
Swap(&a[end], &a[maxi]);
++begin;
--end;
}
}
4.选择排序总结
-
直接选择排序思考非常好理解,但是效率不是很好。实际中很少使用
-
时间复杂度:O(N^2)
-
空间复杂度:O(1)
-
稳定性:不稳定 (例子:5 8 5 2 9)
四.堆排序
1.堆排序思想:
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是
通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。
2.例子:
3.堆排序源码:
void AdjustDwon(int* a, int size, int parent)
{
int child = parent * 2 + 1;
while (child < size)
{
if (child+1 <size && a[child + 1]>a[child])
{
++child;
}
if (a[child] > a[parent])
{
Swap(&a[child], &a[parent]);
parent = child;
child = parent * 2 + 1;
}
else
{
break;
}
}
}
// 堆排序
void HeapSort(int* a, int n)
{
for (int i = (n - 1 - 1) / 2;i >= 0;i--)
{
AdjustDwon(a, n, i);
}
int end = n - 1;
while (end > 0)
{
Swap(&a[0], &a[end]);
AdjustDwon(a, end, 0);
--end;
}
}
4.堆排序总结:
-
堆排序使用堆来选数,效率就高了很多。
-
时间复杂度:O(N*logN)建堆的时间复杂度就是O(N)
-
空间复杂度:O(1)
-
稳定性:不稳定 (例子:1 2 3 2)
五.冒泡排序
1.冒泡排序的思想:
冒泡排序的英文Bubble Sort,是一种最基础的交换排序。之所以叫做冒泡排序,因为每一个元素都可以像小气泡一样,根据自身大小一点一点向数组的一侧移动。
2.例子:
4,5,6,3,2,1
3.冒泡排序源码:
在原来的冒泡中加入交换定义变量exchange,避免了重复的交换,提高了冒泡排序的效率
// 冒泡排序
void BubbleSort(int* a, int n)
{
assert(a);
for (int i = 0;i < n-1;i++)
{
int exchange = 0;
for (int j = 1;j < n - i;j++)
{
if (a[j -1] > a[j])
{
Swap(&a[j-1], &a[j]);
exchange = 1;
}
}
if (exchange == 0)
{
break;
}
}
}
4.冒泡排序总结:
-
冒泡排序是一种非常容易理解的排序
-
时间复杂度:O(N^2)
-
空间复杂度:O(1)
-
稳定性:稳定 (例子:5 8 5 2 9)
六.快速排序
1.快速排序思想:
快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序元素序列中
的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右
子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。
2.例子:
6 1 2 7 9 3 4 5 10 8
hore版本
依次对左右区间进行排序,每趟排序完后使得基准值的左边都比它小,右边都比它大,直到区间无法再分
挖坑法
将最左边的第一个值作为基准值,也作为坑位,从右边递减向左找到一个比基准值小的数,然后交换,并将该位置作为新的坑位,再从左边递增向右寻找比基准值大的数,然后交换,并将该位置作为新的坑位,依次进行,直到元素集合有序。
前后指针法:
在数组a的begin,mid,end位置的值中,找到一个中间值,cur为前指针,prev为后指针,只要cur的值比key小且cur != prev ,就交换prev和cur,prev++,循环完之后,交换prev和keyi,使prev的值为新的key,直到元素集合有序。
递归改非递归
初始化一个stack,将end,begin入栈,只要stack不为空,就取出栈的两个元素作为left和right,用上诉三种方法其中的一种进行排序,如果keyi+1< right,就把right和keyi+1入栈,如果left < keyi,就把keyi和left入栈。
3.快速排序源码:
int PartSort1(int* a, int begin, int end)
{
int left = begin;
int right = end;
int keyi = left;
while (left < right)
{
while (left < right && a[right] >= a[keyi])
{
--right;
}
while (left < right && a[left] <= a[keyi])
{
++left;
}
Swap(&a[left], &a[right]);
}
Swap(&a[left],&a[keyi]);
keyi = left;
return keyi;
}
//挖坑法
int PartSort2(int* a, int begin, int end)
{
int key = a[begin];
int piti = begin;//坑
while (begin < end)
{
while (begin < end && a[end] >= key)
{
--end;
}
a[piti] = a[end];
piti = end;
while (begin < end && a[begin] <= key)
{
++begin;
}
a[piti] = a[begin];
piti = begin;
}
a[piti] = key;
return piti;
}
int GetMidIndex(int *a, int begin, int end)
{
int mid = (begin + end) / 2;
if (a[begin] < a[mid])
{
if (a[mid] < a[end])
{
return mid;
}
else if (a[begin] < a[end])
{
return end;
}
else
{
return begin;
}
}
else//begin>mid
{
if (a[begin] < a[end])
{
return begin;
}
//begin>end
else if (a[mid] < a[end])
{
return end;
}
else
{
return mid;
}
}
}
int PartSort3(int* a, int begin, int end)
{
int prev = begin;
int cur = begin + 1;
int keyi = begin;
int mid = GetMidIndex(a, begin, end);
Swap(&a[keyi], &a[mid]);
while (cur <= end)
{
if (a[cur] < a[keyi] && ++prev != cur)
Swap(&a[cur], &a[prev]);
++cur;
}
Swap(&a[keyi], &a[prev]);
keyi = prev;
return keyi;
}
// 快速排序
void QuickSort(int* a, int begin, int end)
{
assert(a);
if (begin >= end)
{
return;
}
if (end - begin > 10)
{
int keyi = PartSort3(a,begin,end);
QuickSort(a, begin, keyi - 1);
QuickSort(a, keyi + 1, end);
}
else
{
InsertSort(a+begin, end - begin + 1);
}
}
// 快速排序(非递归)
void QuickSortNonR(int* a, int begin, int end)
{
ST st;
StackInit(&st);
StackPush(&st, end);
StackPush(&st, begin);
while (!StackEmpty(&st))
{
int left = StackTop(&st);
StackPop(&st);
int right = StackTop(&st);
StackPop(&st);
int keyi = PartSort1(a, left, right);
if (keyi + 1 < right)
{
StackPush(&st, right);
StackPush(&st, keyi+1);
}
if (keyi - 1 > left)
{
StackPush(&st, keyi-1);
StackPush(&st, left);
}
}
StackDestroy(&st);
}
4.快速排序总结:
-
快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序
-
时间复杂度:O(N*logN)
-
空间复杂度:O(logN)
-
稳定性:不稳定 (6 8 5 5 2 7 9)
七.归并排序
1.归并排序思想:
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and
Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有
序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
2.例子:
3.归并排序源码:
1.递归
申请一个额外的数组tmp,将元素集合分为大小相等的两个区间(分到不可再分为止),依次将两个(有序)区间中较小的数放到tmp中,再将两个区间中剩余的一个数放到tmp中,在把(end-begin+1)中的数据cp回原数组,最后将申请的额外数组空间释放。
2.非递归
利用gap2来控制分治的两个区间的大小,先判断gap2是否越界,如果越界对其进行修正,然后进行排序(和递归的思想一样),直到gap比n大。
void _MergeSort(int* a, int begin, int end, int* tmp)
{
if (begin > end)
{
return;
}
int mid = (begin + end) / 2;
_MergeSort(a, begin, mid, tmp);
_MergeSort(a, mid + 1, end, tmp);
int begin1 = begin;
int end1 = mid;
int begin2 = mid + 1;
int end2 = end;
int i = begin;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[i++] = a[begin1++];
}
else
{
tmp[i++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[i++] = a[begin1];
}
while (begin2 <= end2)
{
tmp[i++] = a[begin2];
}
memcpy(a+begin,tmp+begin,(end-begin+1)*sizeof(int));
}
void MergeSort(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(a) * n);
if (tmp == NULL)
{
printf("开辟空间失败\n");
exit(-1);
}
_MergeSort(a, 0, n - 1, tmp);
free(tmp);
}
void MergeSortNonR(int* a, int n)
{
int* tmp = (int*)malloc(sizeof(a) * n);
if (tmp == NULL)
{
printf("开辟空间失败\n");
exit(-1);
}
int gap = 1;
while (gap < n)
{
int i = 0;
for (i = 0;i < n;i += 2 * gap)
{
int begin1 = i;
int end1 = i + gap - 1;
int begin2 = i + gap;
int end2 = i + 2 * gap - 1;
int j = 0;
if (begin1 >= n || begin2 >= n)
{
break;
}
else if (end2 >= n)
{
end2 = n - 1;
}
int m = end2 - begin1 + 1;
while (begin1 <= end1 && begin2 <= end2)
{
if (a[begin1] < a[begin2])
{
tmp[j++] = a[begin1++];
}
else
{
tmp[j++] = a[begin2++];
}
}
while (begin1 <= end1)
{
tmp[j++] = a[begin1];
}
while (begin2 <= end2)
{
tmp[j++] = a[begin2];
}
memcpy(a + i, tmp + i, sizeof(int) * m);
}
gap *= 2;
}
free(tmp);
}
4.归并排序总结:
-
归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。
-
时间复杂度:O(N*logN)
-
空间复杂度:O(N)
-
稳定性:稳定 (例子:5 8 5 2 9)
八.计数排序(非比较排序)
1.计数排序思想:
-
统计相同元素出现次数
-
根据统计的结果将序列回收到原来的序列中
2.例子:
3.计数排序源码:
void CountSort(int* a, int n)
{
int min = a[0];
int max = a[n - 1];
int i = 0;
for (i = 0;i < n;i++)
{
if (a[i] < min)
{
min = a[i];
}
if (a[i] > max)
{
max = a[i];
}
}
int range = max - min + 1;
int* count = (int*)malloc(sizeof(int) * range);
if (count == NULL)
{
printf("malloc fail\n");
exit(-1);
}
memset(count, 0, sizeof(int));
for (i = 0;i < n;i++)
{
count[a[i] - min]++;
}
int j = 0;
for (i = 0;i < range;i++)
{
while (count[i]--)
{
a[j++] = i + min;
}
}
}
4.计数排序总结:
-
计数排序在数据范围集中时,效率很高,但是适用范围及场景有限。
-
时间复杂度:O(MAX(N,范围))
-
空间复杂度:O(范围)
九.排序总结:
稳定性:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。
1.排序算法对比
2.内外部排序:
十.排序算法性能测试:
申请大额数据空间,使用rand产生随机数,利用时间函数clock来计算排序算法的运行时长,通过比较运行的时间大小,来比较排序算法的性能优劣,最后再把申请的空间释放。
void TestOP()
{
srand(time(0));
const int N = 1000000;
int* a1 = (int*)malloc(sizeof(int) * N);
int* a2 = (int*)malloc(sizeof(int) * N);
int* a3 = (int*)malloc(sizeof(int) * N);
int* a4 = (int*)malloc(sizeof(int) * N);
int* a5 = (int*)malloc(sizeof(int) * N);
int* a6 = (int*)malloc(sizeof(int) * N);
int* a7 = (int*)malloc(sizeof(int) * N);
for (int i = 0; i < N; ++i)
{
a1[i] = rand();
a2[i] = a1[i];
a3[i] = a1[i];
a4[i] = a1[i];
a5[i] = a1[i];
a6[i] = a1[i];
a7[i] = a1[i];
}
//ShellSort(a1, N);
int begin1 = clock();
//InsertSort(a1, N);
int end1 = clock();
int begin2 = clock();
//ShellSort(a3, N);
int end2 = clock();
int begin3 = clock();
//SelectSort(a3, N);
int end3 = clock();
int begin4 = clock();
HeapSort(a4, N);
int end4 = clock();
int begin5 = clock();
QuickSort(a4, 0, N - 1);
int end5 = clock();
int begin6 = clock();
//MergeSort(a6, N);
int end6 = clock();
int begin7 = clock();
//BubbleSort(a7, N);
int end7 = clock();
printf("InsertSort:%d\n", end1 - begin1);
printf("ShellSort:%d\n", end2 - begin2);
printf("SelectSort:%d\n", end3 - begin3);
printf("HeapSort:%d\n", end4 - begin4);
printf("QuickSort:%d\n", end5 - begin5);
printf("MergeSort:%d\n", end6 - begin6);
printf("BubbleSort:%d\n", end7 - begin7);
//printf("callCount:%d\n", callCount);
//printf("%p\n", &callCount);
free(a1);
free(a2);
free(a3);
free(a4);
free(a5);
free(a6);
free(a7);
}