任务1:实现随机化的第K元素选择算法O(n)
知识点:快速选择算法(快排) 划分 随机化
#include <iostream>
#include <ctime>
#include <cstdlib>
#include <vector>
using namespace std;
void swap(vector<int> &a, int x, int y) {
int temp = a[x];
a[x] = a[y];
a[y] = temp;
}
int partition(vector<int> &a, int left, int right) {
int p = a[left];
while (left < right) {
//使得p右边的都大于等于p
while (left < right && a[right] >= p)
right--;
a[left] = a[right]; //小于则放左边
//p左边的都小于等于p
while (left < right && a[left] <= p)
left++;
a[right] = a[left]; //大于则放右边
}
//left和right相遇 把p放在合适的位置 完成划分
a[left] = p;
return left; //返回划分的位置
}
//随机化划分
int randomPartition(vector<int> &a, int left, int right) {
//产生一个[a, b]范围内的随机整数,可以使用以下通用公式:rand()%(b-a+1)+a
int r_num = rand() % (right - left + 1) + left;
swap(a, r_num, left);
return partition(a, left, right);
}
//随机选择,从a[left,right]中返回第k大的数
int randomSelect(vector<int> &a, int left, int right, int k) {
if (left >= right)
return a[left];
int p = randomPartition(a, left, right); //划分后的主元位置p 左边p-left个数
int m = p - left + 1; //a[p]就是第p-left+1大的数
if (k == m)
return a[p]; //刚好主元就是第k大
else if (k < m)
return randomSelect(a, left, p - 1, k);
else
return randomSelect(a, p + 1, right, k - m); //k>m这种情况注意更新k为k-m
}
int main() {
srand((unsigned) time(nullptr)); //设置种子
int size;
cout << "输入规模:" << endl;
cin >> size; //大小
vector<int> a; //创建一个向量存储数字
int temp = 0;
cout << "输入数据:" << endl;
for (int i = 0; i < size; i++) {
cin >> temp;
a.push_back(temp);
}
int k = 0;
cout << "输入k:" << endl;
cin >> k;
int result = randomSelect(a, 0, a.size() - 1, k); //注意第三个参数为a.size()-1
cout << "第" << k << "大数字是" << result << endl;
return 0;
}
运行截图:
思路:
实现了从给定的数字集合中随机选择第k大的数字。它使用了快速选择算法(QuickSelect)的变体,通过随机化划分过程来改进算法的性能。
partition
划分函数主要实现快速排序的划分步骤,以a[left]作为主元(pivot),重新排列数组,使得主元左边的元素都小于或等于主元,右边的元素都大于或等于主元,然后返回主元在数组中的位置。
randomPartition
随机划分函数首先随机选择一个位置r_num,然后交换a[r_num]和a[left]。然后调用partition
函数进行划分,返回划分后的主元位置。
randomSelect
函数是核心部分,递归选择第k大的数字。首先,如果left大于等于right,则直接返回a[left]。然后划分,获取主元位置p。下来有三种情况:
- k等于m(主元刚好是第k大) 返回a[p]
- k小于m,则在主元左侧递归查找
- k大于m,则在主元右侧递归查找,注意此时要更新k为k-m
通过随机化划分过程,能够减少最坏情况发生的概率,从而提高算法的平均性能。快速选择算法的平均时间复杂度为O(n)