题目大意
给定一个长度为n的数列,给出m个询问,每个询问的内容为:统计指定闭区间[l,r]内不同元素的个数。
1<n,m<=2e6
问题分析
-
问题规模巨大,暴力枚举显然会超时。
-
因为操作中只有询问没有更新,所以可以使用离线算法。
-
经验判断。。。这一道可以用树状数组解决的问题,但分析如下:
-
这里我们需要求得任意区间内的不同元素个数,不同区间经常会存在在不同程度的重叠,直接枚举显然会做很多重复计算。我们知道前缀和是一种很棒的思想,它可以让我们在O(1)的时间复杂度内快速求得区间和。我们便会思考是否能利用前缀和这种思想来解决这一问题。
-
当使用前缀和时,对于查询区间[l.r],我们希望能以如下方式得到答案:ans=sum[r]-sum[l-1],可见对应与前缀和的原始被计数的数组a[]来说,a[i]应该存放的是“i处为不同于之前元素的个数”,也就是说,如果i处的元素是未出现的(不重复的),则a[i]=1;如果i处的元素是重复的,则a[i]=0。但重复与否与查询区间有关,重复指的是在查询区间内发生重复,区间外不影响对重复的统计。这就意味着a[i]的值不应该简单的一次确定好,而是应该随着查询区间的变化来做出调整;a[i]的变化也势必会引起sum[i]…sum[n-1]的变化,所以sum[i]也不会简单的一次确定好。直接更新前缀和数组的时间复杂度为O(n),这样处理n次更新的复杂度就会变成O(n^2),这不太好。对于具有这种动态特性的前缀和,我们有强大而简单的树状数组工具!利用树状数组,我们可以在O(log n)内实现原始元素及前缀和记录的修改,也可以在这一复杂度内实现前缀和的获取。
-
对于任意区间[l,r]来说,我们可以只关心元素k的最后一次出现,也就是之间最后一次出现做统计。为了实现复用,我们可以将查询按照上界r升序排列,因为最后一次的出现总是越来越靠后的。我们用一个数组last[]记录下元素k上次出现的位置,用树状数组c[](对应原始被计数数组a[],事实上并不用设置这个数组,它只是逻辑上存在的)来做重复性统计,每当出现新的元素k时,就将a[k]设为1,将k上次出现的位置last[k]对应的记录a[last[k]]设为0(实现时,如果a[last[k]]已经为1,则将其减1即可)
AC代码
#include <cstdio>
#include <string>
#include <algorithm>
struct Query
{
int l,r,idx;
friend bool operator<(const Query & a,const Query & b){return a.r<b.r;}
};
const int maxf=1e6+10;
const int maxn=maxf;
int last[maxf];
int c[maxn];
int a[maxn];
int ans[maxn];
Query queries[maxn];
void add(int x,int t)
{
while(x<=maxn)
{
c[x]+=t;
x+=x&(-x);
}
}
int sum(int x)
{
int ans=0;
while(x>=1)
{
ans+=c[x];
x-=x&(-x);
}
return ans;
}
using namespace std;
int main()
{
int n,m;
scanf("%d",&n);
for(int i=1;i<=n;i++)
scanf("%d",&a[i]);
scanf("%d",&m);
for(int i=1;i<=m;i++)
scanf("%d%d",&queries[i].l,&queries[i].r),queries[i].idx=i;
sort(queries+1,queries+m+1);
int k=1;
for(int i=1;i<=m;i++)
{
int l=queries[i].l,r=queries[i].r;
for(;k<=r;k++)
{
if(last[a[k]])
add(last[a[k]],-1);
add(k,1);
last[a[k]]=k;
}
ans[queries[i].idx]=sum(r)-sum(l-1);
}
for(int i=1;i<=m;i++)
printf("%d\n",ans[i]);
return 0;
}