题目大意:给你n个数,有q个询问,每次询问[L,R]区间内有多少个不同的数。
思考1:区间问题,线段树?但是对于线段树来说如何用区间合并更新答案呢?我们可以在每个节点处申请一个用于保存的数组,然后记录下出现的值以及其出现位置的左右端点,但显而易见,把问题更复杂化了。
思考2:冗余计算在哪里?首先看看如果我们最暴力的扫描一遍能得到什么。我们可以统计出有多少个不同的数以及他们各自出现了多少次。现在我们考虑两次相邻的询问,我们以最复杂的区间相交来考虑。
原区间为[pL,pR],新区间为[qL,qR]。当原区间向新区间移动的时候,pL->qL为右移,经过的元素不再属于新的区间,因此要剔除,pR->qR为右移动,所经过的元素为要加进去新区间的元素。算法规则如下:
1)某个元素的数量由0突增至1,则表示加入了新的元素
2)某个元素的数量由1突减至0,则表示区间内已无该元素
3)pL->qL如果为右移,则将经过的元素i对应的数量num[i]--,如果为左移,则将经过的元素i对应的数量num[i]++
4)pR->qR如果为右移,则将经过的元素i对应的数量num[i]++,如果为左移,则将经过的元素i对应的数量num[i]--
复杂度分析:我们将所有查询按照左端点的大小排序,排序复杂度为O(nlogn),左端点的移动次数为O(n),右端点频繁移动最坏情况下可能会高达O(n^2)。
思考3:上述步骤的不足之处在于只能保证左端点的右移,而不能保证右端点在左移和右移间频繁切换。因此可以做一个折中,不完全保证左端点一直右移,也不完全保证右端点一直右移动【因为题目的输入本身就会导致不可能兼得,例如[1,4]->[2,3]】。借用分块的思想进行优化,将左端点当作块间规则指标,将右端点当作是块内规则指标,即规定块大小为k,区间[l,r]对应的块为l/k,不同块的区间按照区间号从小到大排序,同块的区间按照右端点排序。一般取k=sqrt(n)。
代码:
#include<iostream>
#include<algorithm>
#include<cmath>
using namespace std;
struct Query{
int l,r,index,res;
};
Query query[10005];
int Arr[10005],n,k,q,i,L,R,num[10005],ans,j;
bool cmp(Query A,Query B){
if(A.l/k==B.l/k){
return A.r<B.r;
}
else return A.l<B.l;
}
bool cmp1(Query A,Query B){
return A.index<B.index;
}
int main(){
cin>>n>>q;
k=sqrt(n);
for(i=1;i<=n;i++){
cin>>Arr[i];
}
for(i=1;i<=q;i++){
cin>>L>>R;
query[i]=Query{L,R,i,0};
}
sort(query+1,query+1+q,cmp);
L=query[1].l;
R=query[1].r;
for(i=L;i<=R;i++){//预处理第一个区间
if(!num[Arr[i]]){
ans++;
}
num[Arr[i]]++;
}
query[1].res=ans;
for(i=2;i<=q;i++){
if(L<=query[i].l){//新区间左端点在右边
for(j=L;j<query[i].l;j++){
num[Arr[j]]--;
if(!num[Arr[j]])ans--;//突减
}
}
else{
for(j=query[i].l;j<L;j++){
if(!num[Arr[j]])ans++;//突增
num[Arr[j]]++;
}
}
if(R<=query[i].r){//新区间右端点在右边
for(j=R+1;j<=query[i].r;j++){
if(!num[Arr[j]])ans++;//突增
num[Arr[j]]++;
}
}
else{
for(j=query[i].r+1;j<=R;j++){
num[Arr[j]]--;
if(!num[Arr[j]])ans--;//突减
}
}
query[i].res=ans;
}
sort(query+1,query+1+q,cmp1);
for(i=1;i<=q;i++){
cout<<i<<":"<<query[i].res<<endl;
}
return 0;
}