[Daimayuan] 全部相等（C++，数学）

最新推荐文章于 2024-06-15 18:06:06 发布

WitheredSakura_

最新推荐文章于 2024-06-15 18:06:06 发布

阅读量625

点赞数

分类专栏：数学文章标签： c++ 算法开发语言数学离散化

本文链接：https://blog.csdn.net/m0_74036684/article/details/131185820

版权

数学专栏收录该内容

22 篇文章 0 订阅

订阅专栏

* 注：题名的灵感来自代码源 #914: 一半相等

给定长度为 $n$ 的数组 ${A}$ 。

派派非常喜欢 所有元素出现频率相同 的数组，但这样的数组却不常有。派派很伤心 (;´༎ຶД༎ຶ`)。不过聪明的你，发现总能从 ${A}$ 中挑选一个子序列满足上述条件。问此子序列最长为多长？

数据规模

$1≤n≤2×10^5$
$A_i∈[1,10^9]$

输入格式

输入包含两行，第一行有一个整数 $n$ ，表示 ${A}$ 的大小。

接下来一行包含 $n$ 个用空格分隔的整数，依次表示 $A_1,A_2,⋯,A_n$ 。

输出格式

输出答案。

样例 1 输入

6
1 3 2 1 4 2

样例 1 输出

解释：

[1,3,2,1,4,2] 满足条件且最长。

样例 2 输入

4
100 100 4 100

样例 2 输出

样例 3 输入

8
1 2 3 3 3 2 6 6

样例 3 输出

解题思路

根据题意，我们有这样一种直觉：

所选择的公共词频过低的时候，会有很多元素，但是每个元素出现的次数很少；

所选择的公共词频过高的时候，会有很少的元素，但是每个元素出现的次数很多。

类似于下面这个简单的函数：
$y=-x^2$
所以我们知道答案在区间的中间位置，但是应该如何搜索？

因为答案不具有单调性，所以不能二分搜索。

所以我们直接~~放弃思考~~开始爆搜。

在统计词频过程中，由于取值范围过大，使用map容器进行离散化。

然后将数据转移到vector容器中进行排序，方便后续操作。

最后是本题的关键，搜索代码部分：

while (temp_freq) {
	while (iter != arr.end() && temp_freq <= iter->first) {
		cnt++;
		iter++;
	}
	ans = max(ans, temp_freq * cnt);//每次统计结束后更新答案（ans=所选词频*元素数量）
	temp_freq--;
}

对于每一个键值对，我们以词频作为键值，然后根据键值降序排序。

从高频开始尝试，这样可以不断拓展元素的数量，而不是每次都要重新计算。

AC代码如下：

#include <iostream>
#include <map>
#include <vector>
#include <algorithm>
using namespace std;
const int max_n = 2e5;
const int max_a = 1e9;

int n;
map<int, int>freq;
vector<pair<int, int>>arr;

int main() {
	cin >> n;
	int temp;
	for (int i = 0; i < n; i++) {
		cin >> temp;
		freq[temp]++;
	}
    
	for (auto iter : freq) arr.push_back({iter.second,iter.first});
	sort(arr.begin(), arr.end(), [](pair<int, int>p1, pair<int, int>p2) {
		return p1.first > p2.first;
		});
	
    int temp_freq = arr.begin()->first, cnt = 0;
	int ans = 0;
	vector<pair<int, int>>::iterator iter = arr.begin();
	while (temp_freq) {
		while (iter != arr.end() && temp_freq <= iter->first) {
			cnt++;
			iter++;
		}
		ans = max(ans, temp_freq * cnt);
		temp_freq--;
	}
	cout << ans << endl;
	return 0;
}