(1) 简单选择排序 O(N^2)
一趟简单选择排序的操作为:通过n-i 次关键字间的比较,从n-i+1 个记录中选择出关键字最小的记录,并和第 i (i<=i<=n)个记录交换之。
#include<iostream.h>
/***************************************
* 简单选择排序 Simple Selection Sort *
***************************************/
class SimpleSelectSort{
public:
//递增排序
static void inc_sort(int keys[],int size);
};
void SimpleSelectSort :: inc_sort(int keys[], int size){
for(int i=0;i<size;i++){
int min_key=keys[i]; //存储每一趟排序的最小值
int min_key_pos=i; //存储最小值的位置
for(int j=i+1;j<size;j++){
if(min_key>keys[j]){ //定位最小值
min_key=keys[j];
min_key_pos=j;
}
}
keys[min_key_pos]=keys[i]; //将选择的最小值交换位置
keys[i]=min_key;
}
for(int k=0;k<size;k++)
cout<<keys[k]<<" ";
cout<<endl;
}
//Test SimpleSelectSort
void main(){
int raw[]={49,38,65,97,76,13,27,49};
int size=sizeof(raw)/sizeof(int);
SimpleSelectSort::inc_sort(raw,size);
}
简单选择排序的时间复杂度为O(N^2),空间复杂度为O(1),排序方法是稳定的 。这种排序方法在n个关键字中选出最小值,至少进行n-1次比较,然而,继续在剩余的n-1个关键字中选择次小值就并非一定要进行n-2次比较了。下面的树形选择排序后一轮比较可以利用前一轮的比较结果,从而大大减少比较的次数。
(2) 树形选择排序 O(N * logN)
树形选择排序(Tree Selection Sort),又称竞标赛排序(Tournament Sort),是一种按照竞标赛思想进行的选择排序方法。首先对n个记录的关键字两两比较,然后在其中[n/2]个较小者之间在进行两两比较,如此重复,直至选出最小关键字的记录为止。这个过程可用一颗有n个叶子结点的完全二叉树表示。 下图展示了树形选择排序的过程:
(a)图选择出最小值13需要7次比较,但是(b)图选择第二小的27就只需要3次了。应为(a)图中的最小值13已经找到,只需要在(b)图中将13的位置赋值为无穷大,这样,就只需要再次比较树的一部分就可以找到第二小的值。
#include<iostream.h>
#include<malloc.h>
#define MAX_INT 32767;
typedef struct sort_node{
int key; //待排关键字
int pos; //此关键字在待排序列中的位置
}SortNode;
int level=1;
SortNode **level_point;
//记录每一层的关键字容量的连续空间
int *level_count;
//记录已经排序号的关键字序列
int *sorted_keys;
//释放多维指针
void freeAll(SortNode ** deleted, int size){
for(int i=0;i<size;i++)
free(deleted[i]);
}
//递增排序
void inc_sort(int keys[],int size){
//开辟存储排序序列的容量
sorted_keys=(int *)malloc(size*sizeof(int));
//根据待排序列的数量确定排序树的层次
int a_size=size;
bool isPower=true;
if(a_size>1){
while(a_size!=1){
if(a_size%2==1)
isPower=false;
level++;
a_size/=2;
}
}
if(isPower==false) level++;
//够着排序树的内存结构,为每一层开辟可以容纳一定数量关键字的内存空间
level_point=(SortNode **)malloc(level*sizeof(SortNode *));
level_count=(int *)malloc(level*sizeof(int));
int level_size=size;
for(int l=0;l<level;l++){
level_count[l]=level_size;
level_point[l]=(SortNode *)malloc(level_size*sizeof(SortNode));
level_size=level_size/2+level_size%2;
}
//为第0层赋值待排序列,并建立排序树,找到第一次最小的关键字
for(int i=0;i<size;i++){
level_point[0][i].key=keys[i];
level_point[0][i].pos=i;
}
int cur_level=1;
while(cur_level<level){
for(int j=0;j<level_count[cur_level];j++){
int left_child=level_point[cur_level-1][j*2].key;
//没有右孩子
if((j*2+1)>=level_count[cur_level-1]){
level_point[cur_level][j].key=left_child;
level_point[cur_level][j].pos=level_point[cur_level-1][j*2].pos;
}else{
int right_child=level_point[cur_level-1][j*2+1].key;
level_point[cur_level][j].key=left_child<=right_child ? left_child : right_child;
level_point[cur_level][j].pos=left_child<=right_child ? level_point[cur_level-1][j*2].pos : level_point[cur_level-1][j*2+1].pos;
}
}
cur_level++;
}
//打印第一次的树形选择排序:
cout<<"第1次树形选择排序 (关键字 - 关键字在待排表中的位置):"<<endl;
for(int u=level-1;u>=0;u--){
for(int i=0;i<level_count[u];i++)
cout<<"("<<level_point[u][i].key<<"-"<<level_point[u][i].pos<<") ";
cout<<endl;
}
//第一次树形排序的最小值和最小位置
int cur_min_key=level_point[level-1][0].key;
int cur_min_pos=level_point[level-1][0].pos;
sorted_keys[0]=cur_min_key;
//输出剩下size-1个最小的数
for(int count=1;count<=size-1;count++){
level_point[0][cur_min_pos].key=MAX_INT;
//找到需要重新比较的两个位置
int a_pos=cur_min_pos;
int b_pos=a_pos%2==0 ? a_pos+1 : a_pos-1;
for(int m=1;m<level;m++){
if(b_pos>=level_count[m-1]){
level_point[m][a_pos/2].key=level_point[m-1][a_pos].key;
level_point[m][a_pos/2].pos=level_point[m-1][a_pos].pos;
}else{
level_point[m][a_pos/2].key=level_point[m-1][a_pos].key<=level_point[m-1][b_pos].key ? level_point[m-1][a_pos].key : level_point[m-1][b_pos].key;
level_point[m][a_pos/2].pos=level_point[m-1][a_pos].key<=level_point[m-1][b_pos].key ? level_point[m-1][a_pos].pos : level_point[m-1][b_pos].pos;
}
a_pos=a_pos/2;
b_pos=a_pos%2==0 ? a_pos+1 : a_pos-1;
}
//记录每一次树形排序的最小值和对应的位置
cur_min_key=level_point[level-1][0].key;
cur_min_pos=level_point[level-1][0].pos;
sorted_keys[count]=cur_min_key;
//打印第count次的树形选择排序:
cout<<"第"<<(count+1)<<"次树形选择排序 (关键字 - 关键字在待排表中的位置):"<<endl;
for(int u=level-1;u>=0;u--){
for(int i=0;i<level_count[u];i++)
cout<<"("<<level_point[u][i].key<<"-"<<level_point[u][i].pos<<") ";
cout<<endl;
}
}
//打印排序好的序列
cout<<endl<<endl<<"排序序列:";
for(int k=0;k<size;k++)
cout<<sorted_keys[k]<<" ";
cout<<endl;
free(level_count);
free(sorted_keys);
freeAll(level_point,level);
}
//Test
void main(){
int raw[]={49,38,65,97,76,13,27,49};
int size=sizeof(raw)/sizeof(int);
inc_sort(raw,size);
}
树形选择排序需要建立一棵含n个叶子结点的完全二叉树,其深度为[logN]+1。因此,除第一次排序需要比较n次以外,其余每一次树形选择排序都只需要比较logN次。因此树形选择排序的时间复杂度为O(N*logN) 。但是这种排序方法大量额外的空间,一棵n个叶子结点的满二叉树有2n-1个结点。则对N个关键字的树形选择排序需要近2N左右的结点。空间复杂度为O(2N) 。该方法也是稳定的排序 。
树形选择排序仍然有很多缺点,比如空间代价高,需要和无穷大关键字做比较等。为了弥补,J.willioms在1964年提出了下面的另一种选择排序——堆排序。
(3) 堆排序
堆的定义如如下:n个元素的序列{K0 ... K(n-1)},当且仅当满足下关系时,称之为堆。(注: 序列从下标0作为第一个元素开始)
ki <= k(2i+1) && ki <= k(2i+2) —— 小顶堆
ki >= k(2i+1) && ki >= k(2i+2) —— 大顶堆
若将此序列对应的一维数组(序列的内存结构)看成是一个完全二叉树,即Ki 的左孩子是K(2i+1),右孩子是K(2i+2)。则堆的含义就是,完全二叉树中所有非终结点的值均不大于(不小于)其左、右孩子结点的值。因此,堆顶元素K0就是整个序列的最小值了。
堆排序的算法流程:
首先,将待排序列整理成堆。即从序列的第[n/2]-1个元素(完全二叉树最后一个非终结点)开始,到第0个结点为止调整堆。具体过程见下图:
然后,输出堆顶元素K0后,用当前堆中最后一个元素K(n-1)代替堆顶。并将待排序列减少一个(最后一个元素已经移到了第0号位置),接着调整堆,即将移动后的堆顶元素向下调整(保证小顶堆)。具体过程如下图:
最后,依次循环下去,直到输出序列的全部元素为止。
#include<iostream.h>
/*********************
* 堆排序 Heap Sort *
*********************/
class HeapSort{
public:
//递增排序
static void inc_sort(int keys[], int size);
private:
//创建堆
static void create(int keys[],int size);
//调整堆
static void adjust(int keys[],int var_size);
//交换
static void swap(int keys[],int pos_a,int pos_b);
};
//创建堆
void HeapSort :: create(int keys[],int size){
for(int i=(size-1)/2;i>=0;i--){
int lchild=i*2+1;
int rchild=i*2+2;
while(lchild<size){
int next_pos=-1;
if(rchild>=size&&keys[i]>keys[lchild]){
HeapSort ::swap(keys,i,lchild);
next_pos=lchild;
}
if(rchild<size){
int min_temp=keys[lchild]<=keys[rchild] ? keys[lchild] : keys[rchild];
int min_pos=keys[lchild]<=keys[rchild] ? lchild : rchild;
if(keys[i]>keys[min_pos]){
swap(keys,i,min_pos);
next_pos=min_pos;
}
}
if(next_pos==-1) break;
lchild=next_pos*2+1;
rchild=next_pos*2+2;
}
}
}
//调整堆
void HeapSort :: adjust(int keys[],int var_size){
int pos=0;
while((pos*2+1)<var_size){
int next_pos=-1;
if((pos*2+2)>=var_size&&keys[pos]>keys[pos*2+1]){
swap(keys,pos,pos*2+1);
next_pos=pos*2+1;
}
if((pos*2+2)<var_size){
int min_keys=keys[pos*2+1]<=keys[pos*2+2] ? keys[pos*2+1] : keys[pos*2+2];
int min_pos=keys[pos*2+1]<=keys[pos*2+2] ? (pos*2+1) : (pos*2+2);
if(keys[pos]>min_keys){
swap(keys,pos,min_pos);
next_pos=min_pos;
}
}
if(next_pos==-1) break;
pos=next_pos;
}
}
//递增排序
void HeapSort :: inc_sort(int keys[], int size){
HeapSort::create(keys,size);
int var_size=size;
while(var_size>0){
cout<<keys[0]<<" "; //Êä³öÿһÂÖ¶ÑÅÅÐòµÄ×îСֵ
keys[0]=keys[var_size-1];
--var_size;
adjust(keys,var_size);
}
}
//keys[pos_a] <-> keys[pos_b]
void HeapSort :: swap(int keys[],int pos_a,int pos_b){
int temp=keys[pos_a];
keys[pos_a]=keys[pos_b];
keys[pos_b]=temp;
}
//Test HeapSort
void main(){
int raw[]={49,38,65,97,76,13,27,49};
int size=sizeof(raw)/sizeof(int);
HeapSort::inc_sort(raw,size);
}
堆排序方法对记录较少的文件效果一般,但对于记录较多的文件还是很有效的。其运行时间主要耗费在创建堆和反复调整堆上。堆排序即使在最坏情况下,其时间复杂度也为O(N*logN) 。这一点比快速排序 要好。另外,堆排序所需要的空间复杂度为O(1) 。但却是不稳定排序 。