用户喜好
题目链接
题目简介
为了不断优化推荐效果,今日头条每天要存储和处理海量数据。假设有这样一种场景:我们对用户按照它们的注册时间先后来标号,对于一类文章,每个用户都有不同的喜好值,我们会想知道某一段时间内注册的用户(标号相连的一批用户)中,有多少用户对这类文章喜好值为k。因为一些特殊的原因,不会出现一个查询的用户区间完全覆盖另一个查询的用户区间(不存在L1<=L2<=R2<=R1)。
解题思路
- 区间查询我们可以联想到前缀和
- 首先可以想到构建一个函数 f f f返回从第一个标号开始到某一标号某一喜好值得用户总数,这样我们就可以用 f ( r ) − f ( l − 1 ) f(r)-f(l-1) f(r)−f(l−1)获得区间 l − r l-r l−r的用户总数
- 那么如何构建这样的函数呢?我们可以考虑构建一个特殊的数据结构,通过二分查询获得用户总数
- 数据结构:考虑为每一个喜好值构建一个数组,依次读入每一个用户的喜好值,并在对应喜好值数组添加(append)对应的用户标号(这样保证用户标号是升序排列)
代码
#include<bits/stdc++.h>
using namespace std;
map<pair<int,int>,int>presum;
map<int,int>idx;
int n,q,l,r,k;
int find_section(int num,int id){
int l=0,r=idx[num]-1,mid;
if(presum[make_pair(num,l)]>id)return 0;
if(presum[make_pair(num,r)]<id)return idx[num];
while(l<r){
mid = (l+r+1)/2;
if(presum[make_pair(num,mid)]==id)return mid+1;
else if(presum[make_pair(num,mid)]<id)l=mid;
else r=mid-1;
}
return l+1;
}
int main(){
ios::sync_with_stdio(0);
cin.tie(0);
cin >> n;
int num;
for(int i=1;i<=n;i++){
cin >> num;
presum[make_pair(num,idx[num])] = i;
idx[num]++;
}
cin >> q;
for(int i=1;i<=q;i++){
cin >> l >> r >> k;
cout << find_section(k,r) - find_section(k,l-1) << "\n" ;
}
}