题目:
为了不断优化推荐效果,今日头条每天要存储和处理海量数据。假设有这样一种场景:我们对用户按照它们的注册时间先后来标号,对于一类文章,每个用户都有不同的喜好值,我们会想知道某一段时间内注册的用户(标号相连的一批用户)中,有多少用户对这类文章喜好值为k。因为一些特殊的原因,不会出现一个查询的用户区间完全覆盖另一个查询的用户区间(不存在L1<=L2<=R2<=R1)。
输入描述:
输入:
第1行为n代表用户的个数 第2行为n个整数,第i个代表用户标号为i的用户对某类文章的喜好度
第3行为一个正整数q代表查询的组数
第4行到第(3+q)行,每行包含3个整数l,r,k代表一组查询,即标号为l<=i<=r的用户中对这类文章喜好值为k的用户的个数。
数据范围n <= 300000,q<=300000 k是整型
输出描述:
输出:一共q行,每行一个整数代表喜好值为k的用户的个数
示例:
输入
5
1 2 3 3 5
3
1 2 1
2 4 5
3 5 3
输出
1
0
2
说明
样例解释:
有5个用户,喜好值为分别为1、2、3、3、5,
第一组询问对于标号[1,2]的用户喜好值为1的用户的个数是1
第二组询问对于标号[2,4]的用户喜好值为5的用户的个数是0
第三组询问对于标号[3,5]的用户喜好值为3的用户的个数是2
解析:
一般来讲给人的直觉是直接往数组里搜索就好,但是,其结果往往会导致某些区域重复扫描次数过多,这也是导致时间复杂度O(n^2)过大的原因。
虽然很想尝试用动态规划,但空间复杂度不允许,因此,这里需要一些讨巧的方法。
我们再来分析超时的原因:
对于区间[l,r]寻找元素k的个数,我们要查询的长度为整个区间长度,在目标元素个数相对较少,数组元素多样的情况下,使得查找时间大多数落在错误的元素上。
因此我们可以尝试直驱目标,将个元素出现的位置记录下来,这样在寻找目标元素时,我们就只需要找出目标元素出现的位置中,有多少次是符合指定区间的。
在寻求的都是不同元素的情况下,其总时间复杂度为O(n),因为各个元素片段总和为n
#include <iostream>
#include <vector>
#include <map>
#include <queue>
#include <algorithm>
using namespace std;
int main()
{
int n,q;
cin >> n;
//制造一个字典,存储出现的元素以及他陆续出现的位置
map<int, vector<int>> m;
for(int i=1;i<=n;i++)
{
int x;
cin >> x;
//将出现的位置压入到数组最后
m[x].push_back(i);
}
cin >> q;
for(int i=0;i<q;i++)
{
int l, r,k,count=0;
cin >> l >> r >> k;
//若不存在这个喜好度,则直接输出0
if(m.find(k)==m.end())
{
cout << 0 << endl;
}
else
{
//陆续选择满足区间的目标元素出现的位置
for(vector<int>::const_iterator iter=m[k].begin();iter!=m[k].end();iter++)
{
if(*iter>=l&&*iter<=r)
{
count++;
}
}
cout << count << endl;
}
}
}