排序,就是整理文件中的记录,使之按照关键字递增(或递减)的顺序排列起来。
内部排序与外部排序的区别:
在排序过程中,若整个文件都是放在内存中处理,排序时不涉及数据的内外存交换,就为内部排序。
反之,若排序过程中要进行数据的内外存交换,则称为外部排序。
适用条件:
内部排序适用于记录个数不很多的小文件。
外排序则适用于记录个数太多,不能一次将其全部记录放入内存的大文件。
排序算法的基本操作:
(1) 比较关键字的大小;(比较)
(2) 改变指向记录的指针或移动记录本身。(交换)
待排文件的常用存储方式:
(1) 以顺序表存储——排序过程:对记录本身进行物理重排,即通过关键字之间的比较判定,将记录移动到合适的位置
(2) 以链表作为存储结构——排序过程:无需移动记录,仅需修改指针。
(3) 用顺序表的方式存储待排序的记录,但同时建立一个辅助表——排序过程:只需要对辅助表的表目进行物理重排。适用于难于在链表上实现,但扔需避免排序过程中移动记录的排序方法。
什么是稳定的排序?
在待排序的文件中,若存在关键字相同的记录,经过排序后这些具有相同关键字的记录之间的相对次序保持不变,该排序算法是稳定的。反之是不稳定的。
性能评价:
(1) 执行时间和所需的辅助时间。
(2) 算法本身的复杂程度。
空间复杂度:若排序算法所需的辅助空间并不依赖于问题的规模n,即辅助空间是O(1),则称为就地排序。
排序的时间开销:主要是关键字之间的比较和记录的移动。
排序算法可以分为5类:
插入排序、选择排序、交换排序、归并排序、分配排序。
一、 插入排序
插入排序分为:直接插入排序(稳定)、希尔(shell)排序(不稳定)
排序思想:每次将一个待排序的记录,按其关键字大小插入到前面已排好的子数组中的适当位置,直到全部记录插入完成为止。
直接插入排序
时间复杂度O(n*n)空间复杂度:O(1)
直接插入排序思想:
假设待排记录存放在数组R[1…n]中,初始时,R[1]自成一个有序区,无序区为R[2…n]。从i=2开始到i=n结束,一次将R[i]插入到当前有序区R[1…i-1]中,生成含n个记录的有序区。
第(i-1)次直接插入排序:通常将记录R[i](i=2…n-1)插入到当前的有序区,使得插入后仍保证该区间里的记录是按关键字有序地操作,称为第i-1次直接插入排序。
方法:查找比较和记录移动操作交替进行,将待插记录R[i]的关键字从右向左依次与有序区中记录R[j](j=i-1,i-2,…1)的关键字进行比较。
具体代码:
#include "stdafx.h"
#include <iostream>
using namespace std;
void insert_sort(int a[],int n)
{
int i,j,temp;
for (i=1;i<n;i++) //需要选择n-1次
{
temp = a[i]; //暂存下标为i的数
for (j=i-1; j>=0&&temp<a[j]; j--)
{
a[j+1] = a[j]; //如果条件满足就后移
}
a[j+1] = temp; //找到下标为i的数的存放位置
}
}
void print_array(int a[],int len)
{
for (int i=0;i<len;i++)
{
cout<<a[i]<<" ";
}
cout<<endl;
}
int _tmain(int argc, _TCHAR* argv[])
{
int a[]={49,38,65,97,76,13,27,49};
cout<<"before insert sort:";
print_array(a,8);
insert_sort(a,8);
cout<<"after insert sort:";
print_array(a,8);
system("pause");
return 0;
}
运行结果:
希尔排序:
时间复杂度O(n*logn)空间复杂度:O(1)
为什么引入希尔排序?
在直接插入排序算法中,,每次插入一个数,使有序序列只增加一个节点,并且对插入下一个数没有提供任何帮助。如果比较相隔远的距离数,使得数移动时能够跨过多个元素,则进行一次比较就能消除多个元素交换。
为什么shell排序时间性能优于直接插入排序?
(1) 当数组初始状态基本有序时,直接插入排序所需的比较和移动次数均较少;
(2) 当n值较小时,n和n*n的差别也较小,即直接插入排序的最好时间复杂度O(n)和最坏时间复杂度O()差别不大。
(3) 在shell排序开始时增量较大,分组较多,每组的记录数目少,故个分组内直接插入较快,后来增量d逐渐减少,分组数逐渐减少,而各组记录逐渐增多,但由于已经按d-1作为距离完成排序,使数组较接近于有序状态,所以新的一次排序过程也较快。综上:shell排序在效率上比直接插入排序有较大的改进。
具体代码:
#include "stdafx.h"
#include <iostream>
using namespace std;
void shell_sort(int a[],int len)
{
int h,i,j,temp;
for (h=len/2;h>0;h=h/2)
{
for (i=h;i<len;i++)
{
temp = a[i];
for (j=i-h; (j>=0&&temp<a[j]); j-=h) //控制增量
{
a[j+h] = a[j];
}
a[j+h] = temp;
}
}
}
void printf_array(int a[],int len)
{
for (int i=0; i<len; i++)
{
cout<<a[i]<<" ";
}
cout<<endl;
}
int _tmain(int argc, _TCHAR* argv[])
{
int a[]={49,38,65,97,76,13,27,49};
cout<<"before shell sort:";
printf_array(a,8);
shell_sort(a,8);
cout<<"after shell sort:";
printf_array(a,8);
system("pause");
return 0;
}
运行结果:
参考资料:程序员面试宝典(电子工业出版社)