这几天作快速排序时,针对源数据倒序这一极端情况测试快速排序算法的性能时,发现如果枢轴元素取区间的首、尾、中间三元素的中间值的时候。如果使用取中值算法一,那么性能下降的特别厉害,而利用取中值得算法二时,时间复杂度很正常。经过努力,终于发现了其中的原因。参见:快速排序过程的优化(续)
测试过程构造了一个50个元素的数组,数组元素按降序排列,通过函数运行过程进行分析。
(1)快速排序在调用算法一取中间值时,函数的执行过程如下图所示:
从图中可以看出,对于后半部分的排序过程来讲,每次只进行了一个元素的排序,也就是说,对于排序过程中一半的元素,算法的性能蜕变为O(n^2)级别,导致总体的时间复杂度为O(n^2)。究其原因,应该是,取枢轴元素的的过程中总是将中值与左侧元素交换,而原数组又是非常有规律的一个序列,这样通过程序不断执行,数据不断的交换,就造成了现在的结果。可以说取中值的算法和倒序数组在某种程度上发生了“耦合”,产生了“共振效应”,以致出现这样的结果。在算法设计的时候要考虑这样的情况,使自己的算法尽量避免和任何数据耦合,这样算法的时间效率才会稳定。
(2)通过改进,采用算法二进行取中值的操作,则避免了上面那个问题。下图是程序的运行结果:
(3)测试程序全部源代码:
#include <iostream>
#include <fstream>
#include <string>
#include <stdlib.h>
#include <time.h>
#include <sys/time.h>
#define MAX 1000000
using namespace std;
void SelectPivotMid(int a[], int left, int right){
int pivotPos = left;
int mid = (right + left)/2;
mid = mid > left && mid + 1 < right ? mid + 1 : mid;
if(a[mid] <= a[left]){
if(a[left] <= a[right]){
pivotPos = left;
}else{
if(a[mid] <= a[right]){
pivotPos = right;
}else{
pivotPos = mid;
}
}
}else{
if(a[mid] <= a[right]){
pivotPos = mid;
}else{
if(a[left] <= a[right]){
pivotPos = right;
}else{
pivotPos = left;
}
}
}
int tmp = a[pivotPos];
a[pivotPos] = a[left];
a[left] = tmp;
}
void SelectPivotMid_2(int arr[],int low,int high)
{
int mid = low + ((high - low) >> 1);//计算数组中间的元素的下标
//使用三数取中法选择枢轴
if (arr[mid] > arr[high])//目标: arr[mid] <= arr[high]
{
swap(arr[mid],arr[high]);
}
if (arr[low] > arr[high])//目标: arr[low] <= arr[high]
{
swap(arr[low],arr[high]);
}
if (arr[mid] > arr[low]) //目标: arr[low] >= arr[mid]
{
swap(arr[mid],arr[low]);
}
//此时,arr[mid] <= arr[low] <= arr[high]
//return arr[low];
//low的位置上保存这三个位置中间的值
//分割时可以直接使用low位置的元素作为枢轴,而不用改变分割函数了
}
//快速排序3,首、尾、中三数取中为枢轴
void quick_sort_3(int a[], int left, int right){
if(left < right){
SelectPivotMid_2(a, left, right);
int pivot = a[left];
int i = left, j = right;
while(i < j){
while(i < j && a[j] > pivot){
j--;
}
if(i < j){
a[i] = a[j];
i++;
}
while(i < j && a[i] < pivot){
i++;
}
if(i < j){
a[j] = a[i];
j--;
}
}
a[i] = pivot;
for(int j = left; j < i; j++){
cout << a[j] << ",";
}
cout << " " << " #" << a[i] << "# " << " ";
for(int j = i+1; j < right + 1; j++){
cout << a[j] << ",";
}
cout <<endl;
quick_sort_3(a, left, i - 1);
quick_sort_3(a, i + 1, right);
}
}
int main()
{
int a[50] = {0};
for (int i = 0; i < 50; i++){
a[i] = 49 - i;
}
quick_sort_3(a, 0, 49);
return 1;
}