离散化概念、用途
用处: 有些数据本身很大, 自身无法作为数组的下标保存对应的属性,我们可以对这些数进行离散化处理。
假如,有一组数{1、2、100、2000、10000、109},这组数有个特点,就是值域最大可以取到109甚至更大,但是这组数的个数很少,最多只有105左右。而有一些题,需要我们把这些数当作下标来做题,对于这么大的数,我们总不可能开一个109的数组,但是,我们可以用离散化来解决。
离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。
通俗的说,离散化是在不改变数据相对大小
的条件下,对数据进行相应的缩小。
举个例子: 2、99、200、3000、10000、离散化处理后,我们把这几个数分别映射到下标为1、2、3、4、5的数组中去。
离散化的步骤
1、先将所有需要离散化的数据放到一个容器里(这里用的是vector)
2、排序+去重,排序是因为离散化时需要用到二分。去重是我们要保证相同数据离散化后对应的数组下标相同。
二分查找后返回的值就是离散化后的下标了。
部分代码
alls.erase(unique(alls.begin(),alls.end()),alls.end());
这个去重代码,unique是将这一组数中重复的数全部放到数组的最后,并返回重复区间的第一个数的下标,再将这个下标到这组数的最后进行erase删除操作,就完成去重了。
比如sort后的数为,{1、3、6、6、13、13、20},unique操作是先让这组数变成{1、3、6、13、20、6、13},再返回第二个6的下标,earse再将这个下标到最后一个下标的数全部删除(这里也就是删除6、13)
例题
ACWing 802. 区间和
假定有一个无限长的数轴,数轴上每个坐标上的数都是0。
现在,我们首先进行 n 次操作,每次操作将某一位置x上的数加c。
接下来,进行 m 次询问,每个询问包含两个整数l和r,你需要求出在区间[l, r]之间的所有数的和。
输入格式
第一行包含两个整数n和m。
接下来 n 行,每行包含两个整数x和c。
再接下里 m 行,每行包含两个整数l和r。
输出格式
共m行,每行输出一个询问中所求的区间内数字和。
数据范围
−109≤x≤109,
1≤n,m≤105,
−109≤l≤r≤109,
−10000≤c≤10000
输入样例:
3 3
1 2
3 6
7 5
1 3
4 6
7 8
输出样例:
8
0
5
#include<iostream>
#include<vector>
#include<algorithm>
using namespace std;
typedef pair<int,int> PII;
const int N=300010;
int n,m;
int a[N],s[N]; //a[]是存的数,s[]是前缀和
vector<int> alls;//存的所有要用到的下标
vector<PII> adds,query; // adds存的是加c、query存询问的数
int find(int x) //二分模板
{
int l=0,r=alls.size()-1;
while(l<r)
{
int mid=(l+r)/2;
if(alls[mid] >= x) r=mid;
else l=mid+1;
}
return l+1; //让下标从 1 开始,因为处理前缀和时下标从 1 开始比较方便
}
int main()
{
cin >> n >> m;
for(int i=0; i<n; i++)
{
int x,c;
cin >> x >> c;
adds.push_back({x,c});
alls.push_back(x); //把需要用到的数据放入vector容器
}
for(int i=0; i<m; i++)
{
int l,r;
cin >> l >> r;
query.push_back({l,r});
把需要用到的数据放入vector容器
alls.push_back(l);
alls.push_back(r);
}
//排序+去重
sort(alls.begin(),alls.end());
alls.erase(unique(alls.begin(),alls.end()),alls.end());
//处理 +c 操作
for(vector<PII> ::iterator it=adds.begin(); it!=adds.end(); it++)
{
int x=find(it->first); // x就是离散化后的下标
a[x]+=it->second;
}
//前缀和
for(int i=1; i<=alls.size(); i++) s[i]=s[i-1]+a[i];
//询问
for(vector<PII> ::iterator it=query.begin(); it!=query.end(); it++)
{
int l=find(it->first),r=find(it->second); //l、r就是离散化后的下标
cout<<s[r]-s[l-1]<<endl;
}
}