TopK的问题及代码实现

TopK的问题在面试的时候经常出现,下面根据参考博客的理论来实现:

参考:
【1】拜托,面试别再问我TopK了!!!
【2】Leetcode 215. 数组中的第K个最大元素

代码实现:

#include <iostream>
#include <vector>
#include <queue>
#include <ctime>
#include <random>
#include <chrono>
#include <functional>
#include <queue>
#include <cassert>
using namespace std;

using FuncPtr = std::function<void(vector<int>&, int)>;

/// 随机生成n个数
void GenerateData(vector<int>& vec, int n) {
  vec.resize(n);
  srand((unsigned int)time(0));
  for (int i = 0; i < n; ++i) {
    vec[i] = rand();
  }
}

///
/// 全排: 直接用sort
/// 时间复杂度:  O(n*logn)
///
void AllSort(vector<int>& vec, int k) {
  assert(vec.size() >= k);
  sort(vec.begin(), vec.end(), std::greater<int>());
  for (int i = 0; i < k; ++i) {
    cout << vec[i] << " ";
  }
  cout << endl;
}

///
/// 局部排序:用冒泡排topk即可(只排topk个)
/// 时间复杂度: O(n*k)
///
void BubblePartSort(vector<int>& vec, int k) {
  assert(vec.size() >= k);
  int size = vec.size();
  for (int i = 0; i < k; ++i) {
    for (int j = 0; j < size - i - 1; ++j) {
      if (vec[j] > vec[j + 1]) {
        swap(vec[j], vec[j + 1]);
      }
    }
  }
  for (int i = size - 1; i >= size - k; --i) {
    cout << vec[i] << " ";
  }
  cout << endl;
}

///
/// 堆排序:topk也不排序了
/// 时间复杂度: O(n*logk)
///
void HeapPartSort(vector<int>& vec, int k) {
  assert(vec.size() >= k);
  int size = vec.size();
  priority_queue<int, vector<int>, greater<int>> pque(vec.begin(), vec.begin() + k);
  for (int i = k; i < size; ++i) {
    if (pque.top() < vec[i]) {
      pque.pop();
      pque.push(vec[i]);
    }
  }
  while (!pque.empty()) {
    cout << pque.top() << " ";
    pque.pop();
  }
  cout << endl;
}

///
/// 堆排序:一趟快排, 一次之后,pivot左边的值全部小于vec[pivot],右边的值全部大于vec[pivot]
/// 时间复杂度: O(n)
/// 参考:Leetcode 215. 数组中的第K个最大元素
///
int Partition(vector<int>& vec, int left, int right) {
  int base = vec[left];
  while (left < right) {
    // 从右向左找第一个小于base的值
    while (left < right && vec[right] >= base) --right;
    // 把它放到左边
    vec[left] = vec[right];
    // 从左向右找第一个大于base的值
    while (left < right && vec[left] <= base) ++left;
    // 把它放到右边
    vec[right] = vec[left];
  }
  vec[left] = base;
  return left;
}
int QuickSelect(vector<int>& vec, int left, int right, int index) {
  int pivot = Partition(vec, left, right);
  if (pivot == index) {
    return vec[pivot];
  } else if (pivot < index) {
    return QuickSelect(vec, pivot + 1, right, index);
  } else {
    return QuickSelect(vec, left, pivot - 1, index);
  }
}
/// 寻找第k大的数
int FindKthLargest(vector<int>& vec, int k) {
  return QuickSelect(vec, 0, vec.size() - 1, vec.size() - k);
}
/// 经过快排后,第k大的数一定在第k个位置上,其右边的数都大于它
void PartitionSort(vector<int>& vec, int k) {
  int topk = FindKthLargest(vec, k);
  int size = vec.size();
  for (int i = size - 1; i >= size - k; --i) {
    cout << vec[i] << " ";
  }
  cout << endl;
}


void OnExecuteFunc(const vector<int>& vec, int k, FuncPtr func, const std::string& method_name) {
  // 复制数组
  vector<int> ary(vec.begin(), vec.end());
  // 计时开始
  auto start = std::chrono::steady_clock::now();
  // 调用排序函数
  func(ary, k);
  // 结束计时
  auto end = std::chrono::steady_clock::now();
  std::chrono::duration<double, std::micro> elapsed = end - start;
  printf("Method: %s\tTime: %lfs\n", method_name.c_str(), static_cast<double>(elapsed.count()) / 1'000'000);
}

int main() {
  vector<int> vec;
  int n = 1'000'000;
  int k = 10;
  GenerateData(vec, n);

  auto fn = std::bind(OnExecuteFunc, std::cref(vec), k, std::placeholders::_1, std::placeholders::_2);
  fn(AllSort, "直接排序");
  fn(BubblePartSort, "局部冒泡");
  fn(HeapPartSort, "局部堆排");
  fn(PartitionSort, "快排");

  return 0;
}

测试结果:
在这里插入图片描述
扩展: 用快排思想能解决的题目

// 一次快排
int partition(vector<int>& nums, int left, int right) {
  int base = nums[left];
  while (left < right) {
    while (left < right && nums[right] >= base) --right;
    nums[left] = nums[right];
    while (left < right && nums[left] <= base) ++left;
    nums[right] = nums[left];
  }
  nums[left] = base;
  return left;
}

int quickSelect(vector<int>& nums, int left, int right) {
  while (left < right) {
    auto base = partition(nums, left, right);
    int mid = nums.size() / 2;
    if (base == mid) {
      return nums[base];
    } else if (base > mid) {
      right = base - 1;
    } else {
      left = base + 1;
    }
  }
  return -1;
}

int MoreThanHalfNum_Solution(vector<int> numbers) {
  int len = numbers.size();
  if (len == 1) return numbers[0];
  return quickSelect(numbers, 0, len - 1);
}

这题的另一种解法类似消消乐:

class Solution {
public:
    int MoreThanHalfNum_Solution(vector<int> numbers) {
        int len = numbers.size();
        if(len == 1) return numbers[0];
        int val = numbers[0];
        int times = 1; // val出现的次数
        for(int i = 1; i < len; ++i) {
            if(times == 0) {
                val = numbers[i];
                times = 1;
            } else if(val == numbers[i]) {
                ++times;
            } else {
                --times;
            }
        }
        return val;
    }
};
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值