传送门:POJ 2528
题目大意:
有 n 张海报,高度一样,现在告诉你每一张张贴的宽度区间为 [ l , r ] (1<=l<=r<=1e7),问全部张贴完毕后,可以看到几张海报。注意,只要能看到一部分海报就算可以看见。
思路:
最直接的思路就是创建一个数组,初始化为-1,对于第 i 张海报将数组的 [ li , ri ] 区间设为 i (可以看作染为第 i 种颜色),全部处理完后扫描一遍看看有多少个不同的数。但是这样的数组开销太大了,时间复杂度也是O(n^2) 级的,会超时超内存。
首先要对所有的数进行离散化处理,例如,有 n 个不同的大数,在处理它们的时候我们不必开一个数组容纳它们,而是将它们排序后,用下标 1~n(也就是排第几)来替换原来的值。这就是离散化处理。
但是这样会出现一个问题,其他讲解该题的文章中也提到过了,例如有一下两组数据:
首先说明一点 [1,2] [3,4]两张海报就把区间 [1,4]全覆盖了,而不必要 [1,2] [2,4]。
例一:[1,10] [1,4] [5,10]
例二:[1,10] [1,4] [6,10]
排序后分别为: 1,4,5,10 和 1,4,6,10
普通离散化后都变成了[1,4][1,2][3,4]
离散后只能看到2张海报,而例二中可以看到3张。
是不是发现问题在哪里了?当两个值不相邻(也就是两数之差 >1 时)不能直接按排第几替换,那怎么办?只要在两数只差 >1 的时候在数组中再增加一个在两数之间的数就好了。即要保证原来相邻的离散化后也相邻,原来不相邻的离散化后也不相邻。
离散化的问题解决了,你可能会问这题跟线段树有毛关系?用线段树来做什么?我的回答是:用线段树来降低时间复杂度,更准确的说是用线段树的延时标记来降低时间复杂度。我曾经只离散化后按照我一开始说的思路交了2次,都是TLE,超时。
先来说一下该题中线段树的节点所代表的含义,开一个 col(颜色)数组,对应着线段树的一个节点。我们知道线段树的每个节点都有它对应的范围 [ l , r ],所以 col 的值就代表它所表示范围的点的颜色,如果为 -1,则表示未被染色。
具体实现:
我们将输入的区间端点存入一个 a 数组中,排序后用 unique 函数去重,然后扫描一遍,如果相邻两数之差大于 1,则加一个数。离散化处理完后,再排序,对于第 i 张海报,用二分搜索函数 find 得到海报左右端点所在的位置(也就是排第几),并同时更新线段树,对该海报对应的区间染色。最后查询该区间有多少种不同的颜色。
再来说一下延时标记的问题,这是这题的关键!
我们知道,在更新的时候,只有当前区间在所查询区间里面的时候才会更新,延时标记的意思就是说,如果你要对区间 [1,4] 染色,则你只对节点1染色就可以了(如第一张图所示),因为节点1就表示区间 [1,4],而不必对1~7的所有节点染色。而当前区间可能一部分在所查询区间内,而这些节点可能是已经被染色而没有任何标记的。想想为什么?因为它的染色标记在它的父亲或祖先节点那。所以当当前区间不在所查询区间里面的时候就要做延时标记,具体做法是:将左右孩子节点染为同当前根节点一样的颜色,而取消当前节点的染色标记,这样的染色区间没变,效果是一样的。如第2、3张图所示。
再来说一下数组开多大的问题,存储区间左右端点的数组毫无疑问开 1e4 即可,而a 数组要存储 l 和 r 的所有值,开2倍就可以喽?不是,别忘了,还有离散化处理的时候要加入的数,最差的情况下每两个相邻的数之间都要加一个数,所以要 a 数组要开4倍。而表示线段树节点的 col 数组呢?假设有 n 个不同的数,线段树的根节点要表示区间 [1, n ],也就是叶子节点有 n 个,所以线段树节点应该有 2*n-1个(不明白的自行百度),也就是开 a数组的两倍大小,8*1e4喽?也对也不对,因为理论值是正确的,但是,当递归进行到线段树的最后一层时,当前节点的左、右孩子是 2*root 和 2*root+1,程序是不知道已经结束了的,还会再一次递归,所以要开原数组的4倍大小。
先别着急走,还有一点是需要注意的,那就是代码中 pos 的值,因为是从下标为1开始存储的,所以 pos的值总是比元素个数大1,所以排序的时候直接写 a+tol 就可以了。另外至于二分搜索,传区间参数的时候应该保证左闭右开,而在缩小查找区间的时候也要保证左闭右开,即 l = mid+1 , r = mid .这样不容易出错,也便于记忆。
终于把这个题彻底的说明白了,真不容易……心疼自己~
#include<stdio.h>
#include<string.h>
#include<iostream>
#include<algorithm>
using namespace std;
//注意a数组开4倍,col数组开16倍
int ans,a[10010*4],col[10010*16],vis[10010*2];
void pushdown(int root)
{ //延迟标记
//让左右子树的根节点染色为当前根节点的染色
col[root<<1]=col[root<<1|1]=col[root];
//当前节点设为为染色
col[root]=-1;
}
void update(int root,int L,int R,int l,int r,int x)
{ //更新函数,参数为:根,大区间,所查询区间, 染第x种色
if(l<=L&&r>=R)
{ //如果当前区间在查询区间内,则染色
col[root]=x;
return;
}
if(col[root]!=-1) pushdown(root);
int mid=(L+R)>>1;
if(mid>=l) update(root<<1,L,mid,l,r,x); //更新左子树
if(mid<r) update(root<<1|1,mid+1,R,l,r,x); //更新右子树
}
void query(int root,int L,int R,int l,int r)
{ //查询函数,参数为:根,大区间,所查询区间
if(L==R)
{ //当前区间只有一个节点
if(!vis[col[root]])
{ //如果当前颜色未被统计过
ans++;
vis[col[root]]=1;
}
return;
}
if(col[root]!=-1) pushdown(root); //延迟标记
int mid=(L+R)>>1;
if(mid>=l) query(root<<1,L,mid,l,r); //查询左子树
if(mid<r) query(root<<1|1,mid+1,R,l,r); //查询右子树
}
int find(int l,int r,int val)
{ //二分查找,返回val的下标,参数:左右端点,要查找的值
int mid;
while(l<r)
{
mid=(l+r)>>1;
if(a[mid]==val) return mid;
else if(a[mid]>val) r=mid;
else l=mid+1;
}
return -1;
}
int main()
{
int i,t,n,l,r,tol,cnt,li[10010],ri[10010];
scanf("%d",&t);
while(t--)
{
memset(col,-1,sizeof(col)); //初始化,相当于建树
memset(vis,0,sizeof(vis));
scanf("%d",&n);
tol=1;
for(i=0;i<n;i++)
{
scanf("%d%d",&li[i],&ri[i]);
a[tol++]=li[i];
a[tol++]=ri[i];
}
sort(a+1,a+tol); //排序
tol=unique(a+1,a+tol)-a; //去重,tol为不同数的个数+1
cnt=tol;
for(i=2;i<cnt;i++)
{
//如果相邻两数之差大于1则在数组尾部插入一个数
if(a[i]-a[i-1]>1)
a[tol++]=a[i-1]+1;
}
sort(a,a+tol); //排序
for(i=0;i<n;i++)
{ //用二分查找获得区间的左右端点
l=find(1,tol,li[i]);
r=find(1,tol,ri[i]);
update(1,1,tol-1,l,r,i);
}
ans=0;
query(1,1,tol-1,1,tol);
printf("%d\n",ans);
}
return 0;
}