概述
排序的分类:内部排序和外部排序
内部排序:数据记录在内存中进行排序
外部排序:因排序的数据量大,需要内存和外存结合使用进行排序
这里总结的八大排序是属于内部排序:
当n比较大的时候,应采用时间复杂度为(nlog2n)的排序算法:快速排序、堆排序或归并排序。
其中,快速排序是目前基于比较的内部排序中被认为最好的方法,当待排序的关键字是随机分布时,快速排序的平均时间最短。
———————————————————————————————————————————————————————————————————————
插入排序——直接插入排序(Straight Insertion Sort)
基本思想:
像排序一手扑克牌。开始时,我们的左手为空并且桌子上的牌面向下。然后,我们每次从桌子上拿走一张牌并将它插入左手中正确的位置。为了找到一张牌的正确位置,我们从右到左将它与已在手中的每张牌进行比较。如图所示,左手上的牌总是排序好的,原来这些牌是在桌子上排堆中顶部的牌。
即:先将序列的第1个记录看成一个有序的子序列,然后从第2个记录逐个进行插入,直至整个序列有序为止。
稳定性:
插入排序是稳定的,因为如果一个带插入的元素和已插入元素相等,那么待插入元素将放在相等元素的后边,所以,相等元素的前后顺序没有改变。
伪代码:
INSERTION-SORT(A)
for j = 2 to A.length
key = A[j]
// insert A[j] into the sorted sequence A[1...j-1]
i = j - 1
while i > 0 and A[i] > key
A[i+1] = A[i]
i = i - 1
A[i+1] = key
算法实现:
#include<iostream>
using namespace std;
void insertion_sort(int A[], int size)
{
int i, j, key;
// note that array element start from index 0
for(int j = 1; j < size; ++j)
{
key = A[j];
// insert A[j] into the sorted sequence A[1...j-1]
i = j - 1;
while(i >= 0 && A[i] > key)
{
A[i+1] = A[i];
i = i - 1;
}
A[i+1] = key;
}
}
void print(int A[], int size)
{
for(int i = 0; i < size; ++i)
cout<<A[i]<<" ";
cout<<endl;
}
int main()
{
int testArray[] = {5, 2, 4, 6, 1, 3};
int ArraySize = 6;
insertion_sort(testArray, ArraySize);
print(testArray, ArraySize);
return 0;
}
分析:
最佳情况:O(n),其中输入数组已排好序
最坏情况:O(n^2),其中输入数组已反向排好序
平均情况:O(n^2)
———————————————————————————————————————————————————————————————————————
插入排序——希尔排序(Shell Sort)
基本思想:
先将整个待排序的记录序列分割成为若干子序列,分别进行直接插入排序,待整个序列中的记录“基本有序”时,再对全体记录依次进行直接插入排序。
操作方法:
- 选择一个增量序列{ t1,t2,t3,...,tk }
- 按增量序列个数k,对序列进行k趟排序;
- 每趟排序,根据对应的增量ti,将待排序序列分割成若干长度为m的子序列,分别对各子序列进行直接插入排序。仅增量因为为1时,整个序列作为一个整表来处理,表长度即为整个序列的长度。
希尔排序的示例:
算法实现:
**如何选择增量序列?
简单选择:增量序列d = { n/2,n/4,n/8,...,1 } ,其中n为要排序数的个数。
#include<iostream>
using namespace std;
void print(int a[], int n)
{
for(int j= 0; j<8; j++){
cout<<a[j] <<" ";
}
cout<<endl;
}
void ShellInsertSort(int a[],int n,int dk)
{
int i,j,tmp;
for(i=dk;i<n;++i)
{
// 如果第i个元素大于第i-dk个元素,直接插入
// 否则
// 小于的话,移动有序表后插入
if(a[i]<a[i-dk])
{
j=i-dk;
tmp=a[i];
a[i]=a[i-dk]; // 复制哨兵,即存储待排序元素
while(tmp<a[j])
{
// 哨兵元素比插入点元素小,后移dk个元素
a[j+dk]=a[j];
j-=dk;
}
a[j+dk]=tmp; // 插入到正确的位置
}
}
}
void ShellSort(int a[],int n)
{
int dk=n/2;
while(dk>=1)
{
ShellInsertSort(a,n,dk);
dk/=2;
}
}
int main()
{
int a[8]={3,1,5,7,3,4,8,2};
print(a,8); // 打印原始序列
ShellSort(a,8);
print(a,8); // 打印排序后的序列
return 0;
}
分析:
可以发现,希尔排序是对简单插入排序算法的一种改进。
但希尔排序是不稳定的排序方法,因为排序过程中可能会改变相同元素在原始序列中的前后关系。
关于希尔排序的时效分析,取决于增量因子序列d的选取,特定情况下可以估算出关键码的比较次数和记录的移动次数。
目前还没有人给出选取最好的增量因子序列的方法。
———————————————————————————————————————————————————————————————————————
选择排序——简单选择排序(Simple Selection Sort)
基本思想:
在要排序的一组数中,选出最小(或者最大)的一个数与第1个位置的数进行交换;然后在剩下的数当中再找最小(或者最大)的数与第2个位置的数交换,依次类推,直到第n-1个元素(倒数第二个数)和第n个元素(最后一个数)比较为止。
简单选择排序示例:
操作方法:
第一趟:从n个记录中找出关键码最小的记录与第一个记录交换;
第二趟:从第2个记录开始的n-1个记录中再选出关键码最小的记录与第2个记录交换;
以此类推...
第 i 趟:从第i个记录开始的n-i+1个记录中选出关键码最小的记录与第i个记录交换,直至整个序列按关键码有序。
算法实现:
#include<iostream>
using namespace std;
void print(int a[], int n ,int i)
{
cout<<"第"<<i+1 <<"趟 : ";
for(int j= 0; j<8; j++){
cout<<a[j] <<" ";
}
cout<<endl;
}
// 返回数组的最小值的键值
int SelectMinKey(int a[],int n,int i)
{
int k=i;
for(int j=i+1;j<n;++j)
if(a[k]>a[j])
k=j;
return k;
}
void SelectSort(int a[],int n)
{
int key,tmp;
for(int i=0;i<n;++i)
{
key=SelectMinKey(a,n,i); // 选择最小的元素
if(key!=i)
{
// 最小元素与第i位置元素互换
tmp=a[i];
a[i]=a[key];
a[key]=tmp;
}
print(a,n,i);
}
}
int main()
{
int a[8]={3,1,5,7,3,4,8,2};
cout<<"原始序列:";
for(int i=0;i<8;++i)
{
cout<<a[i];
if(i==7)
cout<<endl;
else
cout<<" ";
}
SelectSort(a,8);
return 0;
}
———————————————————————————————————————————————————————————————————————
选择排序——堆排序(Heap Sort)
基本思想:
1)初始化堆;将数列[ 1 ... n ]构造成最大化堆
2)交换数据:将a[ 1 ]和a[ n ]交换,使a[ n ]是[ 1 ... n ]中的最大值;然后将[ 1 ... n-1 ]重新调整为最大堆。接着,将a[ 1 ]和a[ n-1 ]交换,使a[ n-1 ]是[ 1 ... n-1 ]中的最大值;然后将[ 1 ... n-2 ]重新调整为最大堆。依次类推,直到整个数列有序。
堆排序的示例:
实现中用到了“数组实现的二叉堆的性质”。
在第一个元素的索引为0的情形中:
性质一:索引为i 的左孩子的索引是(2*i+1);
性质二:索引为i 的右孩子的索引是(2*i+2);
性质三:索引为i 的父节点的索引是floor( ( i-1 ) / 2 );
下面演示对a={20,30,90,40,70,110,60,10,100,50,80}, n=11进行堆排序过程
数组a对应的初始结构:
1 初始化堆:
在堆排序算法中,首先要将待排序的数组转换成最大堆。
下面演示将数组{20,30,90,40,70,110,60,10,100,50,80}转换为最大堆{110,100,90,40,80,20,60,10,30,50,70}的步骤。
1.1 i = n/2 - 1,即i = 4
1.2 i = 3
1.3 i = 2
1.4 i = 1
1.5 i = 0
2 交换数据
在将数组转换成最大堆后,接着要进行交换数据,从而使数组成为一个真正的有序数组。
下面是当n = 10时交换数组的示意图:
当n = 10时,首先交换a[0]和a[10],使得a[10]是a[0 ... 10 ]之间的最大值;然后调整a[0 ... 9 ]使它成为最大堆。交换之后,a[10]是有序的;
当n = 9时,首先交换a[0]和a[9],使得a[9]是a[0 ... 9 ]之间的最大值;然后调整a[0 ... 8 ]使它成为最大堆。交换之后,a[9]是有序的;
... ...
依次类推,直到a[0 ... 10 ]是有序的。
算法实现:
#include<iostream>
using namespace std;
void maxheap_down(int a[],int start,int end)
{
int current=start; // 当前结点的位置
int left=2*current+1; // 左孩子的位置
int tmp=a[current]; // 当前节点的大小
for(;left<=end;current=left,left=2*left+1)
{
if(left<end&&a[left]<a[left+1])
++left; // 左右孩子中选择较大者
if(tmp>=a[left])
break; //调整结束
else
{
// 交换值
a[current]=a[left];
a[left]=tmp;
}
}
}
void HeapSort(int a[],int n)
{
int i,tmp;
// 从(n/2-1) --> 0逐次遍历。遍历之后,得到的数组实际上是一个(最大)二叉堆。
for(i=n/2-1;i>=0;--i)
maxheap_down(a,i,n-1);
// 从最后一个元素开始对序列进行调整,不断的缩小调整的范围直到第一个元素
for(i=n-1;i>0;--i)
{
// 交换a[0]和a[i]。交换后,a[i]是a[0...i]中最大的
tmp=a[i];
a[i]=a[0];
a[0]=tmp;
// 调整a[0...i-1],使得a[0...i-1]仍然是一个最大堆;
// 即,保证a[i-1]是a[0...i-1]中的最大值
maxheap_down(a,0,i-1);
}
}
int main()
{
int i;
int a[]={20,30,90,3,21,11,60,10,23,50,80};
int len=(sizeof(a))/(sizeof(a[0]));
cout<<"原始序列:";
for(i=0;i<len;++i)
cout<<a[i]<<" ";
cout<<endl;
HeapSort(a,len);
cout<<"堆排序后的序列:";
for(i=0;i<len;++i)
cout<<a[i]<<" ";
cout<<endl;
return 0;
}
分析:
时间复杂度:O(nlog2n)
遍历一趟的时间复杂度是O(n);
堆排序是采用二叉堆进行排序的,二叉堆就是一棵二叉树,它需要遍历的次数就是二叉树的深度,而根据完全二叉树的定义,它的深度至少是log2(n+1),最多也不会超过log22n。因此,遍历次数介于log2(n+1)和log22n之间;因此得出它的时间复杂度是O(nlog2n)。
堆排序稳定性:不稳定的
它在交换数据的时候,是比较父节点和子节点之间的数据,所以即使是存在两个数值相等的兄弟结点,它们的相对顺序在排序中也可能发生变化。
———————————————————————————————————————————————————————————————————————
交换排序——冒泡排序(Bubble Sort)
基本思想:
在要排序的一组数中,对当前还未排好序的范围内的全部数,自上而下对相邻的两个数依次进行比较和调整,让较大的数往下沉,较小的数往上冒。
即:每当相邻的数比较后发现它们的顺序与排序要求相反时,就将它们互换。
冒泡排序的示例:
算法实现:
#include<iostream>
using namespace std;
void print(int a[], int n ,int i)
{
cout<<"第"<<i+1<<"趟 : ";
for(int j= 0; j<8; j++){
cout<<a[j]<<" ";
}
cout<<endl;
}
void BubbleSort(int r[],int size)
{
int i,j,temp;
bool exchange; //交换标志
for(i=0;i<size;i++)
{
exchange=false; //本趟排序开始前,交换标志设为假
for(j=size-1;j>=i;--j)
if(r[j]<r[j-1])
{
temp=r[j]; //暂存单元
r[j]=r[j-1];
r[j-1]=temp;
exchange=true; //发生了交换,故将交换标志置为真
}
if(!exchange) //本趟没有发生交换,提前终止算法
return;
print(r,size,i);
}
}
int main()
{
int r[8]={3,1,5,7,3,4,8,2};
cout<<"原始序列:";
for(int i=0;i<8;i++)
{
cout<<r[i];
if(i==7)
cout<<endl;
else
cout<<" ";
}
BubbleSort(r,8);
return 0;
}
———————————————————————————————————————————————————————————————————————
交换排序——快速排序(Quick Sort)
基本思想:
1)选择一个基准元素,通常选择第一个元素或者最后一个元素
2)通过一趟排序将待排序的记录分割成独立的两部分,其中一部分记录的元素值均比基准元素值小,另一部分记录的元素值比基准值大。
3)此时基准元素在其排好序后的正确位置
4)然后分别对这两部分记录用同样的方法继续进行排序,直到整个序列有序
快速排序的示例:
a)一趟排序的过程:
b)排序的全过程:
算法实现:
#include<iostream>
using namespace std;
int Partition(int r[],int first,int end)
{
int i=first,j=end,temp; //初始化
while(i<j)
{
//j从后向前扫描,直到r[j]<r[i],将r[j]移动到r[i]的位置,使关键码小(同轴值相比)的记录移动到前面去;
while(i<j && r[i]<=r[j]) --j; //右侧扫描
if(i<j)
{
//将较小记录交换到前面
temp=r[i];
r[i]=r[j];
r[j]=temp;
++i;
}
//i从前向后扫描,直到r[i]>r[j],将r[i]移动到r[j]的位置,使关键码大(同轴值相比)的记录移动到后面去;
while(i<j && r[i]<=r[j]) ++i; //左侧扫描
if(i<j)
{
//将较大记录交换到后面
temp=r[i];
r[i]=r[j];
r[j]=temp;
--j;
}
//重复上述过程,直到i=j
}
return i;
}
void QuickSort(int r[],int first,int end)
{
if(first<end)
{
int pivotpos=Partition(r,first,end); //一次划分
QuickSort(r,first,pivotpos-1); //对前一个子序列进行快速排序
QuickSort(r,pivotpos+1,end); //对后一个子序列进行快速排序
}
}
int main()
{
int r[8]={3,1,5,7,3,4,8,2};
cout<<"原始序列:";
for(int i=0;i<8;i++)
{
cout<<r[i];
if(i==7)
cout<<endl;
else
cout<<" ";
}
QuickSort(r,0,7);
cout<<"排序后的序列:";
for(int i=0;i<8;i++)
{
cout<<r[i];
if(i==7)
cout<<endl;
else
cout<<" ";
}
return 0;
}
分析:
快速排序通常被认为在同数量级(O(nlog2n)中平均性能最好的。但若初始序列按关键码有序或基本有序时,快速排序反而退化为冒泡排序。
为改进之,通常以“三者取中法“来选取基准记录,即将排序区间的两个端点与中点三个记录关键码居中地调整为支点记录。
快速排序是一个不稳定的排序算法。
———————————————————————————————————————————————————————————————————————
归并排序(Merge Sort)
基本思想:
分解:分解待排序的n个元素的序列成各具n/2个元素的两个子序列
解决:使用归并排序递归地排序两个子序列
合并:合并两个已排序的子序列以产生已排序的答案
当待排序的序列长度为1时,递归“开始回升”,在这种情况下不用做任何工作,因为长度为1的每个序列都已排好序。
归并排序示例:
合并方法:
合并过程MERGE(A, p, q, r),其中A是一个数组,p、q和r是数组下标,满足p≤q<r,该过程假设子数组A[p...q]和A[q+1...r]都已排好序,它合并这两个子数组形成单一的已排好序的子数组并代替当前的子数组A[p...r]。过程MERGE需要O(n)的时间,其中n=r-p+1是待合并元素的总数。为避免在每个基本步骤必须检查是否有一个数组已取完全部元素,在每个数组的尾部放置一张哨兵牌,这里我们使用的是∞。
伪代码:
MERGE(A, p, q, r)
n1 = q - p + 1
n2 = r - q
let L[1...n1+1] and R[1...n2+1]
for i = 1 to n1
L[i] = A[p+i-1]
for j = 1 to n2
R[j] = A[q+j]
L[n1+1] = ∞
R[n2+1] = ∞
i = 1
j = 1
for k = p to r
if L[i] ≤ R[j]
A[k] = L[i]
i = i + 1
else A[k] = R[j]
j = j + 1
MERGE-SORT(A, p, r)
if p < r
q = ( p + r ) / 2
MERGE-SORT(A, p, q)
MERGE-SORT(A, q+1, r)
MERGE(A, p, q, r)
分析:
归并排序的时间复杂度是O(nlgn)
归并排序的形式就是一颗二叉树,它需要遍历的次数就是二叉树的深度,而根据完全二叉树的深度可以得出它的时间复杂度是O(nlgn)。
归并排序是稳定的算法,它满足稳定算法的定义。
———————————————————————————————————————————————————————————————————————
桶排序/基数排序(Radix Sort)
基本思想:
将数组分到有限数量的桶子里;
假设待排序的数组a中共有n个整数,并且已知数组a中的数据大小范围是[ 0 , MAX ) 。在桶排序时,创建容量为MAX的桶数组r,并将桶数组的元素都初始化为0;将容量为MAX的桶数组中的每一个单元都看成一个“桶”。
在排序时,逐个遍历数组a,将数组a的值作为“桶数组r”的下标。当a中的数据被读取时,就将相应的桶的值加1。例如,读取到数组a[3]=5,就将r[5]的值+1。
桶排序的示例:
假设a={8,2,3,4,3,6,6,3,9}, max=10。此时,将数组a的所有数据都放到需要为0-9的桶中。如下图:
在将数据放到桶中之后,再通过一定算法将桶中的数据提出来并转换成有序数组,这就得到我们需要的有序序列。
算法实现:
#include<iostream>
#include<cstring> // memset头文件
using namespace std;
void BucketSort(int a[],int n,int max)
{
int i,j;
int buckets[max];
// 将buckets中的所有数据都初始化为0
memset(buckets,0,max*sizeof(int));
// 计数
for(i=0;i<n;++i)
++buckets[a[i]];
// 排序
for(i=0,j=0;i<max;++i)
while((buckets[i]--)>0)
a[j++]=i;
}
int main()
{
int i;
int a[] = {8,2,1,4,3,7,6,3,9};
int len = (sizeof(a))/(sizeof(a[0]));
cout<<"原始序列:";
for(i=0;i<len;++i)
cout<<a[i]<<" ";
cout<<endl;
BucketSort(a,len,10);
cout<<"堆排序后的序列:";
for(i=0;i<len;++i)
cout<<a[i]<<" ";
cout<<endl;
return 0;
}
—————————————————————————————————————————————————————————————————————————————
总结
各种排序的稳定性,时间复杂度和空间复杂度总结:
对n较大的排序记录。一般的选择都是时间复杂度为O(nlog2n)的排序方法。
参考资料:
http://blog.csdn.net/hguisu/article/details/7776068(原文一些排序算法可能有错)
http://www.cnblogs.com/skywang12345/p/3603935.html(个人感觉写的很好的一个博主,已收藏)