* 注:题名的灵感来自 代码源 #914: 一半相等
给定长度为 n n n 的数组 A {A} A。
派派非常喜欢 所有元素出现频率相同 的数组,但这样的数组却不常有。派派很伤心 (;´༎ຶД༎ຶ`)。不过聪明的你,发现总能从 A {A} A 中挑选一个子序列满足上述条件。问此子序列最长为多长?
数据规模
- 1 ≤ n ≤ 2 × 1 0 5 1≤n≤2×10^5 1≤n≤2×105
- A i ∈ [ 1 , 1 0 9 ] A_i∈[1,10^9] Ai∈[1,109]
输入格式
输入包含两行,第一行有一个整数 n n n,表示 A {A} A 的大小。
接下来一行包含 n n n 个用空格分隔的整数,依次表示 A 1 , A 2 , ⋯ , A n A_1,A_2,⋯,A_n A1,A2,⋯,An。
输出格式
输出答案。
样例 1 输入
6
1 3 2 1 4 2
样例 1 输出
4
解释:
[1,3,2,1,4,2] 满足条件且最长。
样例 2 输入
4
100 100 4 100
样例 2 输出
3
样例 3 输入
8
1 2 3 3 3 2 6 6
样例 3 输出
6
解题思路
根据题意,我们有这样一种直觉:
所选择的公共词频过低的时候,会有很多元素,但是每个元素出现的次数很少;
所选择的公共词频过高的时候,会有很少的元素,但是每个元素出现的次数很多。
类似于下面这个简单的函数:
y
=
−
x
2
y=-x^2
y=−x2
所以我们知道答案在区间的中间位置,但是应该如何搜索?
因为答案不具有单调性,所以不能二分搜索。
所以我们直接放弃思考开始爆搜。
在统计词频过程中,由于取值范围过大,使用map
容器进行离散化。
然后将数据转移到vector
容器中进行排序,方便后续操作。
最后是本题的关键,搜索代码部分:
while (temp_freq) {
while (iter != arr.end() && temp_freq <= iter->first) {
cnt++;
iter++;
}
ans = max(ans, temp_freq * cnt);//每次统计结束后更新答案(ans=所选词频*元素数量)
temp_freq--;
}
对于每一个键值对,我们以词频作为键值,然后根据键值降序排序。
从高频开始尝试,这样可以不断拓展元素的数量,而不是每次都要重新计算。
AC代码如下:
#include <iostream>
#include <map>
#include <vector>
#include <algorithm>
using namespace std;
const int max_n = 2e5;
const int max_a = 1e9;
int n;
map<int, int>freq;
vector<pair<int, int>>arr;
int main() {
cin >> n;
int temp;
for (int i = 0; i < n; i++) {
cin >> temp;
freq[temp]++;
}
for (auto iter : freq) arr.push_back({iter.second,iter.first});
sort(arr.begin(), arr.end(), [](pair<int, int>p1, pair<int, int>p2) {
return p1.first > p2.first;
});
int temp_freq = arr.begin()->first, cnt = 0;
int ans = 0;
vector<pair<int, int>>::iterator iter = arr.begin();
while (temp_freq) {
while (iter != arr.end() && temp_freq <= iter->first) {
cnt++;
iter++;
}
ans = max(ans, temp_freq * cnt);
temp_freq--;
}
cout << ans << endl;
return 0;
}