首先是代码:
#include <iostream>
#include <ctime>
using namespace std;
void swap(int &a,int &b)
{
int t = a;
a = b;
b = t;
}
int Partition1(int a[],int p,int r)
{
int beg = p-1;
int idx = p;
int pivot = a[r];
//cout<<p<<" "<<r<<endl;
while (idx <r)//idx<=r是错误的,这是因为beg会越界
{
if (a[idx]<=pivot)//暗含的条件是,当满足这个条件时,beg+1必须是a[beg+1]>pivot,所以才拿a[beg+1]和a[idx]互换;如果遇到a[idx]<pivot才把a[idx]往后仍,可能会出现a[beg+1] = pivot
{
swap(a[++beg],a[idx]);
}
++idx;
}
swap(a[++beg],a[r]);
return beg;
}
int RandomPartition(int a[],int p,int r)
{
srand(time(NULL));
int idx = p +rand()%(r-p+1);
swap(a[idx],a[r]);
return Partition1(a,p,r);
}
int RandomSelect(int a[],int p,int r,int k)//返回第k小的数,注意不是下标,这里的k是指在span[p,r]中的第k小,而不是[0,n-1]的第k小;但是此时的第K小的数的下标肯定是k-1,并且a[0]到a[k-1]就是前k小的数
{
if(p == r)
return a[p];
int idx = RandomPartition(a,p,r);
if(idx - p+1 ==k)
return a[idx];
if(idx -p +1 >k)
return RandomSelect(a,p,idx -1,k);
return RandomSelect(a,idx +1,r,k -idx +p -1);
}
//三数中值分割法:从span[p,r]的p,r和mid选择的中位数作为这个span的pivot;并将这个中位数放在r位置上
void Median3(int a[],int p,int r)
{
if(r-p <2)
return;
int mid = p+(r-p)/2;
if(a[r] <a[p])
swap(a[r],a[p]);
if(a[mid]<a[p])
swap(a[mid],a[p]);
if(a[mid]<a[r])
swap(a[r],a[mid]);
}
int MedianSelect(int a[],int p,int r,int k)//可能还不如随机靠谱
{
if(p == r)
return a[p];
Median3(a,p,r);
int idx = Partition1(a,p,r);
if(idx - p+1 ==k)
return a[idx];
if(idx -p +1 >k)
return MedianSelect(a,p,idx -1,k);
return MedianSelect(a,idx +1,r,k -idx +p -1);
}
int Partition2(int a[],int p,int r)
{
int pivot = a[p];
while (p<r)
{
while (p<r && a[r]>=pivot) --r;
a[p] = a[r];//p位置空缺,这条语句之后是r位置空缺
while (p<r&& a[p]<=pivot) ++p;
a[r] = a[p];//a[r]在上步已经赋予给a[p],所以在这步中,r位置为空;这条语句之后是p位置空缺;
//也就是说在这个循环内,r,p至少有一个是空缺的,当r=p时,那就说明这个位置就是空缺的
}
a[p] = pivot;
return p;
}
void q_sort(int a[],int p,int r)
{
if(p >= r)
return;
int pivotIdx = Partition2(a,p,r);
q_sort(a,p,pivotIdx-1);
q_sort(a,pivotIdx+1,r);
}
int main()
{
int a[] = {0,45,78,55,47,4,1,2,7,8,96,36,45};//0 1 2 4 7 8 36 45 45 47 55 78 96
//q_sort(a,0,sizeof(a)/sizeof(int) -1);
cout<< MedianSelect(a,0,sizeof(a)/sizeof(int) -1,5)<<endl;
for (int i=0;i<sizeof(a)/sizeof(int);++i)
{
cout<<a[i]<<" ";
}
cout<<endl;
/*int b[]={2,1,3};
Median3(b,0,2);
cout<<b[2]<<endl;*/
return 0;
}
下面的链接实现了算法导论中提到的最坏情况线性时间的选择: http://blog.csdn.net/v_JULY_v/article/details/6431001
//copyright@ yansha && July && 飞羽
//July、updated,2011.05.19.清晨。
//版权所有,引用必须注明出处:http://blog.csdn.net/v_JULY_v。
#include <iostream>
#include <time.h>
using namespace std;
const int num_array = 13;
const int num_med_array = num_array / 5 + 1;
int array[num_array];
int midian_array[num_med_array];
//冒泡排序(晚些时候将修正为插入排序)
/*void insert_sort(int array[], int left, int loop_times, int compare_times)
{
for (int i = 0; i < loop_times; i++)
{
for (int j = 0; j < compare_times - i; j++)
{
if (array[left + j] > array[left + j + 1])
swap(array[left + j], array[left + j + 1]);
}
}
}*/
/*
//插入排序算法伪代码
INSERTION-SORT(A) cost times
1 for j ← 2 to length[A] c1 n
2 do key ← A[j] c2 n - 1
3 Insert A[j] into the sorted sequence A[1 ‥ j - 1]. 0...n - 1
4 i ← j - 1 c4 n - 1
5 while i > 0 and A[i] > key c5
6 do A[i + 1] ← A[i] c6
7 i ← i - 1 c7
8 A[i + 1] ← key c8 n - 1
*/
//已修正为插入排序,如下:
void insert_sort(int array[], int left, int loop_times)
{
for (int j = left; j < left+loop_times; j++)
{
int key = array[j];
int i = j-1;
while ( i>left && array[i]>key )
{
array[i+1] = array[i];
i--;
}
array[i+1] = key;
}
}
int find_median(int array[], int left, int right)
{
if (left == right)
return array[left];
int index;
for (index = left; index < right - 5; index += 5)
{
insert_sort(array, index, 4);
int num = index - left;
midian_array[num / 5] = array[index + 2];
}
// 处理剩余元素
int remain_num = right - index + 1;
if (remain_num > 0)
{
insert_sort(array, index, remain_num - 1);
int num = index - left;
midian_array[num / 5] = array[index + remain_num / 2];
}
int elem_aux_array = (right - left) / 5 - 1;
if ((right - left) % 5 != 0)
elem_aux_array++;
// 如果剩余一个元素返回,否则继续递归
if (elem_aux_array == 0)
return midian_array[0];
else
return find_median(midian_array, 0, elem_aux_array);
}
// 寻找中位数的所在位置
int find_index(int array[], int left, int right, int median)
{
for (int i = left; i <= right; i++)
{
if (array[i] == median)
return i;
}
return -1;
}
int q_select(int array[], int left, int right, int k)
{
// 寻找中位数的中位数
int median = find_median(array, left, right);
// 将中位数的中位数与最右元素交换
int index = find_index(array, left, right, median);
swap(array[index], array[right]);
int pivot = array[right];
// 申请两个移动指针并初始化
int i = left;
int j = right - 1;
// 根据枢纽元素的值对数组进行一次划分
while (true)
{
while(array[i] < pivot)
i++;
while(array[j] > pivot)
j--;
if (i < j)
swap(array[i], array[j]);
else
break;
}
swap(array[i], array[right]);
/* 对三种情况进行处理:(m = i - left + 1)
1、如果m=k,即返回的主元即为我们要找的第k小的元素,那么直接返回主元a[i]即可;
2、如果m>k,那么接下来要到低区间A[0....m-1]中寻找,丢掉高区间;
3、如果m<k,那么接下来要到高区间A[m+1...n-1]中寻找,丢掉低区间。
*/
int m = i - left + 1;
if (m == k)
return array[i];
else if(m > k)
//上条语句相当于if( (i-left+1) >k),即if( (i-left) > k-1 ),于此就与2.2节里的代码实现一、二相对应起来了。
return q_select(array, left, i - 1, k);
else
return q_select(array, i + 1, right, k - m);
}
int main()
{
//srand(unsigned(time(NULL)));
//for (int j = 0; j < num_array; j++)
//array[j] = rand();
int array[num_array]={0,45,78,55,47,4,1,2,7,8,96,36,45};
// 寻找第k最小数
int k = 4;
int i = q_select(array, 0, num_array - 1, k);
cout << i << endl;
return 0;
}
其实这个算法也只是在partition改变了,其他流程不变;也就是说它partition的点大概是1/4处的;但是有个地方可以稍微优化,在寻找5的元素的中位数时,没有必要对这5个数全排序,只要排出前三个或者后三个也就能找到中位数了;
july博客总结的很全面:http://blog.csdn.net/v_JULY_v/article/details/6370650
编程之美2.5节也讲得不错