六种常见排序算法分析与实现
前言
本文讲解常见排序算法的分析与实现,具体包括冒泡排序;选择排序;插入排序;希尔排序;归并排序;快速排序;算法实现采用Java和C++两种语言。
一、冒泡排序(时间复杂度O(N^2))
- 通俗理解:冒泡排序把数据分为沉降后和待比较两组,初始状态沉降后元素个数为0,待比较元素个数为所有数组元素。每一趟把待比较元素中“相对最大”的元素放(沉)到沉降后元素的第一个位置。每一趟后待比较元素少一个,直至待比较元素只剩1个,说明最小的元素已经冒到首位,排序完成。
- 排序原理
1.比较相邻的元素。如果前一个元素比后一个元素大,就交换这两个元素的位置。
2.对每一对相邻元素做同样的工作,从开始第一对元素到结尾的最后一对元素。最终最后位置的元素就是最大
值。
- Java代码实现
/*冒泡排序:时间复杂度为n^2*/
public class Bubble {
public static void sort(Comparable[] a)
{
for (int i=a.length-1;i>0;i--) //多少个元素进行排序
{
for (int j=0;j<i;j++) //多少个元素进行比较
{
if(greater(a[j],a[j+1])) //执行次数: (n-1)+(n-2)+...+1=((n-1)+1)*(n-1)/2=n^2/2 - n/2
exch(a,j,j+1); // 最坏情况下执行次数:(n-1)+(n-2)+...+1=((n-1)+1)*(n-1)/2=n^2/2 - n/2
// 因此时间复杂度为 n^2 -n 即O(n^2)
}
}
}
private static boolean greater(Comparable v,Comparable w)
{
return v.compareTo(w)>0;
}
private static void exch(Comparable[] a,int i,int j)
{
Comparable temp;
temp=a[i];
a[i]=a[j];
a[j]=temp;
}
}
- C++代码实现
/* Bubble sort */
#include<iostream>
using namespace std;
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b);
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j);
//printf arrar
template<typename T>
void prt(T data[],int N);
template<typename T>
void bubble(T data[],int N);
int main()
{
int a[]={1,2,3,8,7,6};
prt(a,6);
bubble(a,6);
prt(a,6);
return 1;
}
template<typename T>
void bubble(T data[],int N)
{
for(int i=N-1;i>0;i--)
{
for(int j=0;j<i;j++)
{
if(bigger(data[j],data[j+1])) exch(data,j,j+1);
}
}
}
//printf arrar
template<typename T>
void prt(T data[],int N)
{
for(int i=0;i<N;i++) cout<<data[i]<<" ";
cout<<endl;
}
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b)
{
return a>b;
}
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j)
{
T temp=data[i];
data[i]=data[j];
data[j]=temp;
}
二、选择排序(时间复杂度O(N^2))
- 排序原理
1.每一次遍历的过程中,都假定第一个索引处的元素是最小值,和其他索引处的值依次进行比较,如果当前索引处
的值大于其他某个索引处的值,则假定其他某个索引出的值为最小值,最后可以找到最小值所在的索引
2.交换第一个索引处和最小值所在的索引处的值
- Java代码实现
/*选择排序, 时间复杂度:O(n^2)*/
public class Selection {
public static void Sort(Comparable[] a)
{
for (int i=0;i<=a.length-2;i++) //待选择元素
{
int minIndex=i;
for (int j=i+1;j<a.length;j++) //待比较元素
{
if(greater(a[minIndex],a[j]))
minIndex=j;
}
exch(a,i,minIndex);
}
}
private static boolean greater(Comparable a, Comparable b)
{
return a.compareTo(b)>0;
}
private static void exch(Comparable[] a,int i,int j)
{
Comparable temp=a[i];
a[i]=a[j];
a[j]=temp;
}
}
- C++实现
/* Selection sort */
#include<iostream>
using namespace std;
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b);
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j);
//printf arrar
template<typename T>
void prt(T data[],int N);
template<typename T>
void selection(T data[],int N);
int main()
{
int a[]={8,7,6,3,2,1};
prt(a,6);
selection(a,6);
prt(a,6);
return 1;
}
template<typename T>
void selection(T data[],int N)
{
for(int i=0;i<N-1;i++)
{
int minIndex=i;
for(int j=i;j<N;j++)
{
if(bigger(data[minIndex],data[j]))
{
minIndex=j;
}
}
exch(data,i,minIndex);
}
}
//printf arrar
template<typename T>
void prt(T data[],int N)
{
for(int i=0;i<N;i++) cout<<data[i]<<" ";
cout<<endl;
}
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b)
{
return a>b;
}
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j)
{
T temp=data[i];
data[i]=data[j];
data[j]=temp;
}
三、插入排序(时间复杂度O(N^2))
- 排序原理
1.把所有的元素分为两组,已经排序的和未排序的;
2.找到未排序的组中的第一个元素,向已经排序的组中进行插入;
3.倒叙遍历已经排序的元素,依次和待插入的元素进行比较,直到找到一个元素小于等于待插入元素,那么就把待插入元素放到这个位置,其他的元素向后移动一位;(实际实现方式,用交换元素代替插入元素。即通过将待排序元素加入已排序组,此时,待排序元素在已排序组中的位置可能不对,因此对已排序组进行一次类似冒泡排序。使待排序元素在已排序组中找到合适的位置。)
插入排序的工作方式非常像人们排序一手扑克牌一样。开始时,我们的左手为空并且桌子上的牌面朝下。然后,我
们每次从桌子上拿走一张牌并将它插入左手中正确的位置。为了找到一张牌的正确位置,我们从右到左将它与已在
手中的每张牌进行比较。
- Java实现
/*插入排序;时间复杂度为:O(N^2) */
public class Insertion {
public static void sort(Comparable[] a)
{
for (int i=1;i<a.length;i++) //未排序的元素
{
for (int j=i;j>0;j--) //已排序的元素
{
if(greater(a[j-1],a[j])) //最坏情况的比较次数:n^2/2 - n/2
exch(a,j-1,j); //最坏情况的交换次数:n^2/2 - n/2
else
break;
}
}
}
private static boolean greater(Comparable v,Comparable w)
{
return v.compareTo(w)>0;
}
private static void exch(Comparable[] a,int i,int j)
{
Comparable temp;
temp=a[i];
a[i]=a[j];
a[j]=temp;
}
}
- C++实现
/* Insertion sort */
#include<iostream>
using namespace std;
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b);
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j);
//printf arrar
template<typename T>
void prt(T data[],int N);
template<typename T>
void insertion(T data[],int N);
int main()
{
int a[]={8,7,6,3,2,1};
prt(a,6);
insertion(a,6);
prt(a,6);
return 1;
}
template<typename T>
void insertion(T data[],int N)
{
for(int i=1;i<N;i++)
{
for(int j=i;j>0;j--)
{
if(bigger(data[j-1],data[j])) exch(data,j,j-1);
}
}
}
//printf arrar
template<typename T>
void prt(T data[],int N)
{
for(int i=0;i<N;i++) cout<<data[i]<<" ";
cout<<endl;
}
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b)
{
return a>b;
}
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j)
{
T temp=data[i];
data[i]=data[j];
data[j]=temp;
}
四、希尔排序(时间复杂度O(n^(1.3-2)))
希尔排序是插入排序的一种,又称“缩小增量排序”,是插入排序算法的一种更高效的改进版本。
前面学习插入排序的时候,我们会发现一个很不友好的事儿,如果已排序的分组元素为{2,5,7,9,10},未排序的分组元素为{1,8},那么下一个待插入元素为1,我们需要拿着1从后往前,依次和10,9,7,5,2进行交换位置,才能完成真正的插入,每次交换只能和相邻的元素交换位置。那如果我们要提高效率,直观的想法就是一次交换,能把1放到更前面的位置,比如一次交换就能把1插到2和5之间,这样一次交换1就向前走了5个位置,可以减少交换的次数,这样的需求如何实现呢?接下来我们来看看希尔排序的原理。
- 排序原理
1.选定一个增长量h,按照增长量h作为数据分组的依据,对数据进行分组;
2.对分好组的每一组数据完成插入排序;
3.减小增长量,最小减为1,重复第二步操作。
通过增长量h进行分组,可以实现一次向前走h个位置进行交换元素。每一次增长量减少都会使得数据局部更加有序
- 增长量h的初始值确定规则
h=1;
while(h<N/2)
h=2h+1;
- 增长量h的递减规则,一半一半的递减,直至为1
h=h/2;
- Java实现
public class Shell {
public static void sort(Comparable[] a)
{
int h=1;
while (h<a.length/2)
{
h=2*h+1; //确定增长量h的初值
}
// 分而治之,先让数据局部有需序(各个大组有序,大组逐渐变小组),再进行最终的全部有序
while (h>=1)
{
for (int i=h;i<a.length;i++)
{
for (int j=i;j>=h;j-=h)
{
if(greater(a[j-h],a[j]))
exch(a,j-h,j);
else
break;
}
}
h=h/2; //减小h的值
}
}
private static boolean greater(Comparable a, Comparable b)
{
return a.compareTo(b)>0;
}
private static void exch(Comparable[] a,int i,int j)
{
Comparable temp=a[i];
a[i]=a[j];
a[j]=temp;
}
}
- C++实现
/* Shell sort */
#include<iostream>
using namespace std;
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b);
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j);
//printf arrar
template<typename T>
void prt(T data[],int N);
template<typename T>
void shell(T data[],int N);
int main()
{
int a[]={8,7,6,3,2,1};
prt(a,6);
shell(a,6);
prt(a,6);
return 1;
}
template<typename T>
void shell(T data[],int N)
{
int h=1;
while(h<N/2) //initial h value
h=2*h+1;
while(h>=1)
{
for(int i=h;i<N;i++)
{
for(int j=i;j>=h;j-=h)
{
if(bigger(data[j-h],data[j])) exch(data,j,j-h);
else break;
}
}
h/=2; //decrease h value
}
}
//printf arrar
template<typename T>
void prt(T data[],int N)
{
for(int i=0;i<N;i++) cout<<data[i]<<" ";
cout<<endl;
}
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b)
{
return a>b;
}
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j)
{
T temp=data[i];
data[i]=data[j];
data[j]=temp;
}
- 算法分析
本质上讲,希尔排序算法是直接插入排序算法的一种改进,减少了其复制的次数,速度要快很多。 原因是,当n值很大时数据项每一趟排序需要移动的个数很少,但数据项的距离很长。当n值减小时每一趟需要移动的数据增多,此时已经接近于它们排序后的最终位置。 正是这两种情况的结合才使希尔排序效率比插入排序高很多。Shell算法的性能与所选取的分组长度序列有很大关系。只对特定的待排序记录序列,可以准确地估算关键词的比较次数和对象移动次数。想要弄清关键词比较次数和记录移动次数与增量选择之间的关系,并给出完整的数学分析,今仍然是数学难题。
五、归并排序(时间复杂度O(nlogn))
- 排序原理
1.尽可能的一组数据拆分成两个元素相等的子组,并对每一个子组继续拆分,直到拆分后的每个子组的元素个数是1为止。
2.对每个子组进行排序
3.将相邻的两个子组进行合并成一个有序的大组;
4.不断的重复步骤2,3,直到最终只有一个组为止。
- 实现流程解析
- Java实现
/*归并排序 ,典型的分而治之的策略,先把所有的元素分开,然后再一一攻破;时间复杂度为O(nlogn)*/
public class Merge {
private static Comparable[] assist;//完成归并操作需要的辅助数组
//对数组内的元素进行排序
public static void sort(Comparable[] a)
{
assist=new Comparable[a.length];
int minIndex=0; // 数组中最小的索引
int maxIndex=a.length-1; // 数组中最大的索引
sort(a,minIndex,maxIndex); //对数组中部分元素进行排序
}
//对数组a中从索引lo到索引hi之间的元素进行排序
private static void sort(Comparable[] a, int minIndex, int maxIndex)
{
if(maxIndex<=minIndex)
return;
//将minIndex 到 maxIndex的数据分为两组
int midIndex = minIndex+(maxIndex-minIndex)/2;
//分别对两组数据进行排序
sort(a,minIndex,midIndex);
sort(a,midIndex+1,maxIndex);
//对两组数据进行归并
merge(a,minIndex,midIndex,maxIndex);
}
//从索引lo到所以mid为一个子组,从索引mid+1到索引hi为另一个子组,把数组a中的这两个子组的数据合并成一个有序的大组(从索引lo到索引hi)
private static void merge(Comparable[] a, int minIndex, int midIndex, int maxIndex)
{
//定义三个索引
int leftIndex=minIndex; // 两组中左边一组待比较值的位置索引
int rightIndex=midIndex+1; // 两组中右边一组待比较值的位置索引
int assistIndex=minIndex; // 辅助数组中待插入元素的位置索引
// 一一对应比较两组中的数据,将较小的数据放到辅助数组中,直至有一个组的数据遍历完
while (leftIndex<=midIndex && rightIndex <= maxIndex)
{
if(less(a[leftIndex],a[rightIndex]))
assist[assistIndex++]=a[leftIndex++];
else
assist[assistIndex++]=a[rightIndex++];
}
// 将剩余一个组中的数据,依次放到辅助数组中
while (leftIndex<=midIndex)
assist[assistIndex++]=a[leftIndex++];
while (rightIndex<=maxIndex)
assist[assistIndex++]=a[rightIndex++];
// 将辅助数组中已经排序好的数据移动到原始数组中
for (int i=minIndex;i<=maxIndex;i++)
{
a[i]=assist[i];
}
}
//判断v是否小于w
private static boolean less(Comparable v,Comparable w)
{
return v.compareTo(w)<0;
}
//交换a数组中,索引i和索引j处的值
private static void exch(Comparable[] a,int i,int j)
{
Comparable temp=a[i];
a[i]=a[j];
a[j]=temp;
}
- C++实现
/* Merge sort */
#include<iostream>
using namespace std;
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b);
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j);
//printf arrar
template<typename T>
void prt(T data[],int N);
//data group sort
template<typename T>
void sort(T data[],int N);
//data subgroup sort
template<typename T>
void sort(T data[],int minIndex,int maxIndex);
//subgroup merge
template<typename T>
void merge(T data[],int minIndex,int midIndex,int maxIndex);
//assit array
int assit[6];
int main()
{
int a[]={8,7,6,3,2,1};
prt(a,6);
sort(a,6);
prt(a,6);
return 1;
}
//data group sort
template<typename T>
void sort(T data[],int N)
{
int minIndex=0;
int maxIndex=N-1;
sort(data,minIndex,maxIndex);
}
//data subgroup sort
template<typename T>
void sort(T data[],int minIndex,int maxIndex)
{
if(minIndex>=maxIndex)
return;
int midIndex=minIndex+(maxIndex-minIndex)/2;
sort(data,minIndex,midIndex);
sort(data,midIndex+1,maxIndex);
merge(data,minIndex,midIndex,maxIndex);
}
//subgroup merge
template<typename T>
void merge(T data[],int minIndex,int midIndex,int maxIndex)
{
int leftIndex=minIndex;
int rightIndex=midIndex+1;
int assitIndex=minIndex;
while(leftIndex<=midIndex && rightIndex<=maxIndex)
{
if(bigger(data[leftIndex],data[rightIndex])) assit[assitIndex++]=data[rightIndex++];
else assit[assitIndex++]=data[leftIndex++];
}
while(leftIndex<=midIndex)
{
assit[assitIndex++]=data[leftIndex++];
}
while(rightIndex<=maxIndex)
{
assit[assitIndex++]=data[rightIndex++];
}
for(int i=minIndex;i<=maxIndex;i++)
data[i]=assit[i];
}
//printf arrar
template<typename T>
void prt(T data[],int N)
{
for(int i=0;i<N;i++) cout<<data[i]<<" ";
cout<<endl;
}
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b)
{
return a>b;
}
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j)
{
T temp=data[i];
data[i]=data[j];
data[j]=temp;
}
- 时间复杂度
- 归并排序的缺点:
需要申请额外的数组空间,导致空间复杂度提升,是典型的以空间换时间的操作。
六、快速排序(时间复杂度O(nlogn))
快速排序是对冒泡排序的一种改进。它的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。
- 排序原理
1.首先设定一个分界值(一般取每部分数据中的第一个元素值),通过该分界值将数组分成左右两部分;
2.将大于或等于分界值的数据放到到数组右边,小于分界值的数据放到数组的左边。此时左边部分中各元素都小于或等于分界值,而右边部分中各元素都大于或等于分界值;
3.然后,左边和右边的数据可以独立排序。对于左侧的数组数据,又可以取一个分界值,将该部分数据分成左右两部分,同样在左边放置较小值,右边放置较大值。右侧的数组数据也可以做类似处理。
4.重复2,3步骤,可以看出,这是一个递归定义。通过递归将左侧部分排好序后,再递归排好右侧部分的顺序。当左侧和右侧两个部分的数据排完序后,整个数组的排序也就完成了。
- 切分原理
把一个数组切分成两个子数组的基本思想:
1.找一个基准值,用两个指针分别指向数组的头部和尾部;
2.先从尾部向头部开始搜索一个比基准值小的元素,搜索到即停止,并记录指针的位置;
3.再从头部向尾部开始搜索一个比基准值大的元素,搜索到即停止,并记录指针的位置;
4.交换当前左边指针位置和右边指针位置的元素;
5.重复2,3,4步骤,直到左边指针的值大于右边指针的值停止。
- Java实现
/* 快速排序 最优情况下的时间复杂度是O(nlogn);最坏情况下的时间复杂度是O(n^2);平均情况下的时间复杂度通过归纳法推导可得为O(nlogn)*/
public class Quick {
//对数组内的元素进行排序
public static void sort(Comparable[] a)
{
int minIndex=0;
int maxIndex=a.length-1;
sort(a,minIndex,maxIndex);
}
//对数组a中从索引lo到索引hi之间的元素进行排序
private static void sort(Comparable[] a, int minIndex, int maxIndex)
{
if(maxIndex<=minIndex)
return;
// 将数据中minIndex索引到maxIndex索引之间的元素进行分组(左子组,右子组)
int separatedValues = partition(a, minIndex, maxIndex);
//将左子组有序
sort(a,minIndex,separatedValues-1);
//将右子组有序
sort(a,separatedValues+1,maxIndex);
}
//对数组a中,从索引 minIndex到索引 maxIndex之间的元素进行分组,并返回分组界限对应的索引,保证左子组的元素小于分组界限值,右子组的元素大于分组界限值
public static int partition(Comparable[] a,int minIndex,int maxIndex)
{
//确定分组界限值
Comparable key=a[minIndex];
//定义两个索引值,分别指向待切分元素的最小索引处和最大索引处
int left = minIndex;
int right = maxIndex+1;
//切分
while (true)
{
//先从右往左扫描,移动right索引,直至找到一个比分界值小的元素,停止
while (less(key,a[--right]))
{
if(right==minIndex)
break;
}
//再从左往右扫描,移动left索引,直至找到一个比分界值大的元素,停止
while (less(a[++left],key))
{
if (left==maxIndex)
break;
}
//判断left是否等于right,如果是,则证明元素扫描完毕,结束循环,否则,交换元素
if(left>=right)
break;
else
exch(a,right,left);
}
//交换分界值
exch(a,minIndex,right);
return right; //返回分界值索引
}
//判断v是否小于w
private static boolean less(Comparable v,Comparable w)
{
return v.compareTo(w)<0;
}
//交换a数组中,索引i和索引j处的值
private static void exch(Comparable[] a,int i,int j)
{
Comparable temp=a[i];
a[i]=a[j];
a[j]=temp;
}
}
- C++实现
/* Quick sort */
#include<iostream>
using namespace std;
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b);
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j);
//printf arrar
template<typename T>
void prt(T data[],int N);
//data group sort
template<typename T>
void sort(T data[],int N);
//data sub_array sort
template<typename T>
void sort(T data[],int minIndex,int maxIndex);
//partition array from one to left and right sub_array
template<typename T>
int partition(T data[],int minIndex,int maxIndex);
int main()
{
int a[]={8,7,6,3,2,1};
prt(a,6);
sort(a,6);
prt(a,6);
return 1;
}
//data group sort
template<typename T>
void sort(T data[],int N)
{
int minIndex=0;
int maxIndex=N-1;
sort(data,minIndex,maxIndex);
}
//data subgroup sort
template<typename T>
void sort(T data[],int minIndex,int maxIndex)
{
if(maxIndex<=minIndex)
return;
// data partition
int partitionValue=partition(data,minIndex,maxIndex);
// left sort
sort(data,minIndex,partitionValue-1);
// right sort
sort(data,partitionValue+1,maxIndex);
}
//partition array from one to left and right sub_array
template<typename T>
int partition(T data[],int minIndex,int maxIndex)
{
//separate value -- key
int key = data[minIndex];
//left and right index
int leftIndex=minIndex;
int rightIndex=maxIndex+1;
while(true)
{
// until it find the value less than key
while(bigger(data[--rightIndex],key))
if(minIndex==rightIndex) break;
// until it find the value greater than key
while(bigger(key,data[++leftIndex]))
if(maxIndex==leftIndex) break;
if(leftIndex>=rightIndex)
break;
else
exch(data,rightIndex,leftIndex);
}
exch(data,minIndex,rightIndex);
return rightIndex;
}
//printf arrar
template<typename T>
void prt(T data[],int N)
{
for(int i=0;i<N;i++) cout<<data[i]<<" ";
cout<<endl;
}
//compare the size greater of A and B
template<typename T>
bool bigger(T a,T b)
{
return a>b;
}
//exchage element i data[i] and data[j]
template<typename T>
void exch(T data[],int i,int j)
{
T temp=data[i];
data[i]=data[j];
data[j]=temp;
}
- 快速排序和归并排序的区别
快速排序是另外一种分治的排序算法,它将一个数组分成两个子数组,将两部分独立的排序。快速排序和归并排序是互补的:归并排序将数组分成两个子数组分别排序,并将有序的子数组归并从而将整个数组排序,而快速排序的方式则是当两个数组都有序时,整个数组自然就有序了。在归并排序中,一个数组被等分为两半,归并调用发生在处理整个数组之前,在快速排序中,切分数组的位置取决于数组的内容,递归调用发生在处理整个数组之后。 - 快速排序时间复杂度分析
常见排序算法的稳定性
- 稳定性的定义
数组arr中有若干元素,其中A元素和B元素相等,并且A元素在B元素前面,如果使用某种排序算法排序后,能够保证A元素依然在B元素的前面,可以说这个该算法是稳定的。
- 稳定性的意义
如果一组数据只需要一次排序,则稳定性一般是没有意义的,如果一组数据需要多次排序,稳定性是有意义的。例如要排序的内容是一组商品对象,第一次排序按照价格由低到高排序,第二次排序按照销量由高到低排序,如果第二次排序使用稳定性算法,就可以使得相同销量的对象依旧保持着价格高低的顺序展现,只有销量不同的对象才需要重新排序。这样既可以保持第一次排序的原有意义,而且可以减少系统开销。
- 常见排序算法的稳定性分析