排序,就是根据关键码递增或递减的顺序,把数据记录依次排列起来,使一组任意排列的记录变成一组按其关键码线性有序的记录。
习惯性将待排序的数据用“记录”或“元素”表示,且每一个记录内都有一个排序码域作为排序运算的依据,也可称为“关键码”。
对于评述算法优劣术语的说明
稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面;
不稳定:如果a原本在b的前面,而a=b,排序之后a可能会出现在b的后面;
内排序:所有排序操作都在内存中完成;
外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
时间复杂度: 一个算法执行所耗费的时间。
空间复杂度: 运行完一个程序所需内存的大小。
一 插入排序类
插入排序的基本思想是:每次将一个待排序的记录,按其关键码的大小,插入到前面已经排好序的一组记录的适当位置上,直到记录全部插入为止。
根据查找方法的不同,有多种插入排序方法。
1. 直接插入排序
直接插入排序是通过线性搜索来确定待插入记录的位置。如果前面已经有若干个记录排成非递减序列,则对已排序记录按照从大到小依次逐个与新纪录进行比较,直到找到第一个不大于新纪录的值,这就是新纪录应该插入的位置;依次把新纪录插入到逐步扩大的已排序子序列中,直到最后完全排好序。
算法:
1、在R[0…i-1]中查找R[i]的插入位置j+1,使得R[0…j]<=R[i]<=R[j+1…i-1].
2、将R[j+1…i-1]中所有记录均后移一个位置。
3、将R[i]插入复制到R[j+1]的位置上。
代码:
void InsertionSort(int a[], int n){
int i,j;
for(i=1; i<n; i++){
//n表示数据的大小,i表示插入次数
int temp=a[i]; //将待插入元素暂存
for(j=i-1; j>=0; j--){
//从后向前顺序比较
if(temp<a[j])
a[j+1]=a[j];
else
break;
}
a[j+1]=temp;
}
}
算法分析:
算法用到一个辅助存放待插入记录的临时变量,因此空间代价为一个记录大小,即O(1)。
最好情况下:外层循环迭代n-1次,内层循环0次,比较次数n-1,当前记录保存在临时变量中n-1次,回填n-1次,移动次数共为2(n-1)次,时间复杂度 O ( n ) O(n) O(n)。
最坏情况下:即第 i 趟时第 i 个记录必须与前面 i 个记录都做关键码比较,并且每做一次比较就要做 i 次数据移动,则总的关键码比较次数KCN和记录移动次数RMN分别为:
K C N = ∑ i = 1 n − 1 i = n ( n − 1 ) / 2 ≈ n 2 / 2 KCN=\sum_{i=1}^{n-1} {i} = n(n-1)/2\approx n^2/2 KCN=i=1∑n−1i=n(n−1)/2≈n2/2
R M N = ∑ i = 1 n − 1 ( i + 2 ) = ( n + 4 ) ( n − 1 ) / 2 ≈ n 2 / 2 RMN=\sum_{i=1}^{n-1} {(i+2)} = (n+4)(n-1)/2\approx n^2/2 RMN=i=1∑n−1(i+2)=(n+4)(n−1)/2≈n