文章目录
前言
依然是记录一下算法分析课要求的作业:
通过查找中位数来查找第i小值,要求使用BFPRT算法。
(算法不难,奈何很多细节出错,debug搞的人要崩溃,以后一定记着多测试)
BFPRT算法是解决从n个数中选择第k大或第k小的数这个经典问题的著名算法。可以参考这个链接对其进行详细了解。
1.BFPTR算法的优势
相比快速排序Partion,BFPTR算法通过改变了Partion中的pivot值的选取,即选择五分中位数的中位数作为pivot,使划分更加合理,从而避免了最坏情况的发生。
2.算法步骤
(1)将输入数组的n个元素划分为 [n/5] 组,每组5个元素,且至多只有一个组由剩下的 n%5 个元素组成。
(2)寻找 [n/5] 个组中每一个组的中位数,首先对每组的元素进行插入排序,然后从排序过的序列中选出中位数。
(3)对于(2)中找出的 [n/5] 个中位数,递归进行步骤(1)和(2),直到只剩下一个数即为这 [n/5] 个元素的中位数,找到中位数后并找到对应的下标 P。
(4)进行Partion划分过程,Partion划分中的pivot元素下标为 P。
(5)进行高低区判断即可。
BFPTR算法是将数组按第K小(大)的元素划分为两部分。这高低两部分并不要求有序的,通常我们也不需要求出顺序,而只需要求出比K大的或者比K小的。
另外注意一点,求K就是求第n-K+1小,这两者等价。TOP K问题在工程中有重要应用,所以很有必要掌握。
3.详细思路及具体实现
3.1 实现插入排序
由于这个算法要将一个数组分成很多部分,所以对插入排序进行了一些修改,传入一个数组需要排序的起点l和终点r。
//插入排序
void insort(int a[], int l, int r) {
for(int m=l+1;m<=r;m++)
for (int i = m; i > l; i--) {
if (a[i] < a[i-1]) {
swap(a[i], a[i - 1]);
}
}
}
通过以下代码检验了一下
int tt[6] = { 6,7,1,4,10,5 };
insort(tt, 0, 5);
for (int i = 0; i < 6; i++) {
cout << " " << tt[i];
}
ok,继续下一步
3.2查找中位数的中位数
运用迭代的思想
1)当一开始得到的数组里只有一个数组时,直接返回该元素。
2)找中位数。我假设lenMiddle为中位数的个数,将每五个数字里面找到的中位数依次放在整个数组的前面,便于后面迭代传值。
(在找中位数的过程中,考虑是否有剩下的 n%5 个元素)
3)找中位数的中位数,并返回。
//查找中位数
int selectMiddle(int a[], int l, int r) {
if (l == r) //只有一个数的时候
return a[l];
int len = r - l + 1; //数组长度
int lenMiddle = len / 5; //lenMiddle表示有多少个中位数
if (len % 5 != 0) lenMiddle += 1;
//寻找中位数的中位数
int i = l;
for (int j = 0; j < lenMiddle; j++) {
if ((i + 5) < r) { //五个五个为一组
insort(a, i, i + 4);
swap(a[l+j], a[i + 2]);
i = i + 5;
}
else {//最后剩余的数
int num = r - i + 1;//计算剩余几个数
insort(a, i, i + num - 1);
swap(a[l + j], a[i + num / 2]);
break;
}
}
if (lenMiddle-1 == l) //此时数组只有一个元素,特别注意要减一!!!
return a[lenMiddle];
return selectMiddle(a, l, l + lenMiddle-1);
}
3.3实现下标查找功能
找到中位数的中位数 t 的下标,用于快排传参
//查找元素t在数组中的位置
int findIndex(int a[], int l, int r, int t) {
for (int i = l; i <= r; i++) {
if (a[i] == t)
return i;
}
cout << "没有该元素。 " << endl;
return -1;
}
可以用以下代码对其功能进行检验
//检验findIndex函数
insort(a, 0, N-1);
for (int i = 0; i < N; i++) {
cout << " " << a[i];
}
cout << endl;
cout << "请输入你想找什么元素: " << endl;
int find;
cin >> find;
cout << findIndex(a, 0, N-1, find);
3.4 实现快速排序
和实现插入排序一样,进行了略微的改动,p为已经找到的中位数的中位数的下标
//快速排序
int partion(int a[], int l, int r, int p) {
swap(a[p], a[l]);
int i = l;
int j = r;
int pivot = a[l]; //与普通快排不同的地方,此处为适应该算法进行了改变,使a[p]为轴值,平常用a[l]
while (i < j) {
//从左往右比较,比轴值小则通过,比轴值大则停下,用于交换
while (i < j && a[i] <= pivot)
i++;
a[j] = a[i];
//从右往左比较,比轴值大则通过,比轴值小则停下,用于交换
while (i < j && a[j] >= pivot)
j--;
a[i] = a[j];
}
a[i] = pivot;
return i;
}
3.5 实现BFPTR算法
k为要找的第几小的数的下标
int BFPTR(int a[], int l, int r, int k) {
int MMiddle = selectMiddle(a, l, r); //找到中位数的中位数
int mmIndex = findIndex(a, l, r, MMiddle); //找到中位数的中位数的下标
int m = partion(a, l, r, mmIndex); //找到中位数的中位数在排序后的数组中的具体大小排序
int num = m - l + 1; //num为m在这部分数组中的排序大小
if (k == num) return MMiddle;
else if (k < num)
BFPTR(a, l, m - 1, k); //在中位数的中位数的右边继续找
else
BFPTR(a, m + 1, r, k - num);//在中位数的中位数的右边继续找
//这里因为把最后一个num写成了m
//导致每当要查找的数排在后面的时候就报错
//看了半天终于发现是这里出错了,哭
}
4.完整代码
#include<iostream>
#include<stdlib.h>
#include<time.h>
using namespace std;
#define N 100 //定义每个数组有100个元素
//插入排序
void insort(int a[], int l, int r) {
for(int m=l+1;m<=r;m++)
for (int i = m; i > l; i--) {
if (a[i] < a[i-1]) {
swap(a[i], a[i - 1]);
}
}
}
//查找中位数
int selectMiddle(int a[], int l, int r) {
if (l == r) //只有一个数的时候
return a[l];
int len = r - l + 1; //数组长度
int lenMiddle = len / 5; //lenMiddle表示有多少个中位数
if (len % 5 != 0) lenMiddle += 1;
//寻找中位数的中位数
int i = l;
for (int j = 0; j < lenMiddle; j++) {
if ((i + 5) < r) { //五个五个为一组
insort(a, i, i + 4);
swap(a[l+j], a[i + 2]);
i = i + 5;
}
else {//最后剩余的数
int num = r - i + 1;//计算剩余几个数
insort(a, i, i + num - 1);
swap(a[l + j], a[i + num / 2]);
break;
}
}
if (lenMiddle-1 == l) //此时数组只有一个元素
return a[lenMiddle];
return selectMiddle(a, l, l + lenMiddle-1);
}
//快速排序
int partion(int a[], int l, int r, int p) {
swap(a[p], a[l]);
int i = l;
int j = r;
int pivot = a[l]; //与普通快排不同的地方,此处为适应该算法进行了改变,使a[p]为轴值,平常用a[l]
while (i < j) {
//从左往右比较,比轴值小则通过,比轴值大则停下,用于交换
while (i < j && a[i] <= pivot)
i++;
a[j] = a[i];
//从右往左比较,比轴值大则通过,比轴值小则停下,用于交换
while (i < j && a[j] >= pivot)
j--;
a[i] = a[j];
}
a[i] = pivot;
return i;
}
//查找元素t在数组中的位置
int findIndex(int a[], int l, int r, int t) {
for (int i = l; i <= r; i++) {
if (a[i] == t)
return i;
}
cout << "没有该元素。 " << endl;
return -1;
}
int BFPTR(int a[], int l, int r, int k) {
int MMiddle = selectMiddle(a, l, r); //找到中位数的中位数
int mmIndex = findIndex(a, l, r, MMiddle); //找到中位数的中位数的下标
int m = partion(a, l, r, mmIndex); //找到中位数的中位数的具体大小排序
int num = m - l + 1; //num为m在这部分数组中的排序大小
if (k == num) return MMiddle;
else if (k < num)
BFPTR(a, l, m - 1, k); //在中位数的中位数的右边继续找
else
BFPTR(a, m + 1, r, k - num);//在中位数的中位数的右边继续找
}
int main() {
//生成随机数组
int a[N+1];
srand((unsigned)time(NULL));
for (int i = 0; i < N; i++) {
a[i] = rand() % 200 + 1;
}
//展示随机数组
for (int i = 0; i < N; i++) {
cout << " " << a[i];
}
cout << endl;
//main
int f = 0;
cout << "请输入你想找第几小的元素: " << endl;
cin >> f;
cout << "该数组中第" << f << "小的数字是:" << BFPTR(a, 0, N - 1, f) << endl;
//可以通过排序来检测结果是否正确输出
/*insort(a, 0, N - 1);
for (int i = 0; i < N; i++) {
cout << " " << a[i];
}
cout << endl;*/
return 0;
}
至此,结束。
5.补充
附上朋友用vector写的全过程。(不过此处使用vector并没有太大的优势,仅供参考
#include<iostream>
#include<cstdlib>
#include<ctime>
#include<vector>
using namespace std;
//插入排序(升序)
void insort(vector<int>&a, int l, int r) {
for(int m=l+1;m<=r;m++)
for (int i = m; i > l; i--) {
if (a[i] < a[i-1]) {
swap(a[i], a[i - 1]);
}
}
}
//查找中位数
int selectMiddle(vector<int>&a, int l, int r) {
if (l == r) //只有一个数的时候
return a[l];
int len = r - l + 1; //数组长度
int lenMiddle = len / 5; //lenMiddle表示有多少个中位数
if (len % 5 != 0) lenMiddle += 1;
//寻找中位数的中位数
int i = l;
for (int j = 0; j < lenMiddle; j++) {
if ((i + 4) <= r) { //五个五个为一组
insort(a, i, i + 4);
swap(a[l+j], a[i + 2]);
i = i + 5;
}
else {//最后剩余的数
int num = len%5;//计算剩余几个数
insort(a, i, i + num - 1);
swap(a[l + j], a[i + num / 2]);
break;
}
}
if (lenMiddle-1 == l) //此时数组只有一个元素,即中位数的中位数
return a[lenMiddle];
return selectMiddle(a, l, l + lenMiddle-1);
}
//快速排序
int partion(vector<int>&a, int l, int r, int p) {
swap(a[p], a[l]);
int i = l;
int j = r;
int pivot = a[l]; //与普通快排不同的地方,此处为适应该算法进行了改变,使a[p]为轴值,平常用a[l]
while (i < j) {
//从左往右比较,比轴值小则通过,比轴值大则停下,用于交换
while (i < j && a[i] <= pivot)
i++;
a[j] = a[i];
//从右往左比较,比轴值大则通过,比轴值小则停下,用于交换
while (i < j && a[j] >= pivot)
j--;
a[i] = a[j];
//交换
/*swap( a[i], a[j]);*/
}
a[i] = pivot;
return i;
}
//查找元素t在数组中的位置
int findIndex(vector<int>&a, int l, int r, int t) {
for (int i = l; i <= r; i++) {
if (a[i] == t)
return i;
}
cout << "没有该元素。 " << endl;
return -1;
}
int BFPTR(vector<int>&a, int l, int r, int k) {
int MMiddle = selectMiddle(a, l, r); //找到中位数的中位数
int mmIndex = findIndex(a, l, r, MMiddle); //找到中位数的中位数的下标
int m = partion(a, l, r, mmIndex); //找到中位数的中位数的具体大小排序
int num = m - l + 1; //num为m在这部分数组中的排序大小
if (k == num) return MMiddle;
else if (k < num)
BFPTR(a, l, m - 1, k); //在中位数的中位数的右边继续找
else
BFPTR(a, m + 1, r, k - num);//在中位数的中位数的右边继续找
}
//主函数
int main()
{
int n=0;
cout<<"输入的元素个数:"<<endl;
cin>>n;
vector<int>num(n,0);
srand((unsigned)time(NULL)); //这个不知道是什么
//生成并展示(合并到一起了)
for (int i=0;i<n;i++) {
num[i] = rand()%200+1;
cout<<num[i]<<" ";
}
cout<<endl;
int f = 0;
cout << "请输入你想找第几小的元素: " << endl;
cin >> f;
cout<<"该数组中第"<<f<<"小的数字是:"<<BFPTR(num,0,n-1,f)<<endl;
cout<<"排序后的顺序为:"<<endl;
for(int i=0;i<n;i++)
{
cout<<num[i]<<" ";
}
return 0;
}
6.自我总结
1.理清思路很重要,这道题过程并不复杂。
2.每写完一个函数最好进行测试,比如查找中位数的函数就出现了很多问题,导致后面调代码用了很多时间。