随机选择算法和快速排序原理相似,所以有时候也称作“快速选择算法”,一般选择问题可以证明都能在O(n)时间内完成。随机选择算法的期望运行时间为线性时间,即Θ(n),但其最坏情况运行时间为O(n^2)。最坏情况与快排一样,都是运气不好导致划分不均匀。
代码:
#include "stdafx.h"
#include <iostream>
#include <vector>
#include <stdlib.h>
class QuicklySelect {
public:
template<class T>
void swap(T & a, T & b)
{
T tem = a;
a = b;
b = tem;
}
int Partition(std::vector<int> & nums, int start, int end)
{
int tem = nums[end];
int i = start - 1;
for (int j = start; j < end; j++)
{
if (nums[j] <= tem)
{
i += 1;
swap(nums[i], nums[j]);
}
}
swap(nums[i + 1], nums[end]);
return i + 1;
}
int RandomizedPartition(std::vector<int> & nums, int start, int end)
{
int i = start + rand() % (end - start);
swap(nums[i], nums[end]);
return Partition(nums, start, end);
}
int RandomizedSelect(std::vector<int> & nums, int start, int end, int i)
{
if (nums.empty()) return 0;
if (start == end) return nums[start];
int mid = RandomizedPartition(nums, start, end);
int k = mid - start + 1;
if (i == k)
return nums[mid];
else if (i < k)
return RandomizedSelect(nums, start, mid - 1, i);
else
return RandomizedSelect(nums, mid + 1, end, i - k);
}
};
int main()
{
std::vector<int> nums { 5,3,1,4,2 };//5 3 1 2 4
std::cout << "结果:" << QuicklySelect().RandomizedSelect(nums, 0, nums.size() - 1, nums.size() + 1 - 2) << std::endl;
getchar();
return 0;
}
运行结果:
即4是数组中第2大,第4小的数。
算法题:给定一个大小为n的一维无序数组,从数组中找出前k个最大数,最佳时间复杂度是多少?实际应用中我能想到比如网易云的听歌排行榜会列举出听歌次数最多的前100首歌曲。
这题我是在刷知乎时看到的:https://www.zhihu.com/question/268385292/answer/336806597
若不要求对top k 进行排序,则利用随机选择算法可使期望运行时间达到Θ(n),空间复杂度O(k);若排序则运行时间为Θ(n + klogk),当最坏情况为找所有最大数并排序时,就是排序了,利用快排则时间复杂度为Θ(nlgn)
代码:
#include "stdafx.h"
#include <iostream>
#include <vector>
#include <stdlib.h>
class QuicklySelect {
public:
template<class T>
void swap(T & a, T & b)
{
T tem = a;
a = b;
b = tem;
}
int Partition(std::vector<int> & nums, int start, int end)
{
int tem = nums[end];
int i = start - 1;
for (int j = start; j < end; j++)
{
if (nums[j] <= tem)
{
i += 1;
swap(nums[i], nums[j]);
}
}
swap(nums[i + 1], nums[end]);
return i + 1;
}
int RandomizedPartition(std::vector<int> & nums, int start, int end)
{
int i = start + rand() % (end - start);
swap(nums[i], nums[end]);
return Partition(nums, start, end);
}
int RandomizedSelect(std::vector<int> & nums, int start, int end, int i)
{
if (nums.empty()) return 0;
if (start == end) return nums[start];
int mid = RandomizedPartition(nums, start, end);
int k = mid - start + 1;
if (i == k)
return nums[mid];
else if (i < k)
return RandomizedSelect(nums, start, mid - 1, i);
else
return RandomizedSelect(nums, mid + 1, end, i - k);
}
std::vector<int> Top(std::vector<int> nums, int k)
{
std::vector<int> top;
top.push_back(RandomizedSelect(nums, 0, nums.size() - 1, nums.size() + 1 - k));
for (int i = 0; i < nums.size(); i++)
{
if (nums[i] > top[0])
top.push_back(nums[i]);
}
return top;
}
};
int main()
{
std::vector<int> nums { 5345,332,2341,498,248,89,239,4825,8,43,9892,872,1843 };
std::vector<int> top = QuicklySelect().Top(nums, 5);
for (int i = top.size() - 1; i >= 0; i--)
std::cout << "top" << top.size() - i << ':' << top[i] << std::endl;
getchar();
return 0;
}
记得知乎大多数同学使用的是建最大堆的方法,说是时间复杂度为O(nlgk),空间复杂度为O(k),改天试一试。时间复杂度应该还可以优化。