离散化
使用离散化的情况
假设我们现在要对一些数据进行处理,而这些数据都有几个特征:
- 数据数量不大:在一维数组可以开出来的大小之内。
- 数据的值域很大:若以这个值域进行开辟数组会开不出来。
满足这两个条件就可以使用离散化
离散化的思想
我们将这种数据进行映射,将我们要使用的不连续的值进行映射,映射到一片连续的地方。
举例:
现有5个数据分别为1,20,30000,50000000,1000000000。我们可以将其映射到,0,1,2,3,4,这5块空间中。我们用数组实现,就是有一数组a[],a[0]=1,a[1]=20,a[2]=30000,a[3]=50000000,a[4]=1000000000。暂且将这个数组叫做散列表。
离散化的步骤
- 确定所用到的数据有多少个
- 确定这些数据具体的值
- 将这些值映射到散列表中
- 对散列表按其所代表的值升序排序
- 由于可能会有数据所代表的值是重复的,所以去重
- 按照不同问题逻辑进行设计
- 写一个二分查找函数,进行数据在散列表中的位置查找。
例题
ACwing802
题目描述
有一数轴,其范围从-109到109,我们要对其上n(0<n<105)个点进行加c操作(0<c<10000),然后进行m(r0<m<105)次询问询,问在l到r内所有的值的和是多少。(-109 <= l <= r <= 109)
题目分析
因为进行加c操作最多有105个,还有m(上限105)个询问,每个询问都是l,r两个值,所以我们要开辟的散列表的大小为3*105。
然后去构建一个完整的散列表,这要求我们不能在刚刚输入的时候就进行数据的处理。而是要把操作存起来先去构建一个完整的散列表。
因为我们接下来要去进行散列表的排序和去重,这里利用c++的内置函数实现:
vector<int>a;//散列表
sort(a.begin(),a.end());
a.erase(unique(a.begin(),a.end()),a.end());
建议自行下去了解一下这几个函数
这一步进行完了把每个加c操作执行掉
下一步要执行的就是查询,由于这个题是区间查询,所以我们可以很清楚的想到可以利用前缀和去进行构造。
AC代码
#include <iostream>
#include <algorithm>
#include <cstring>
#include <cmath>
#include <cstdio>
#include <vector>
#define in(x) scanf("%d",&x)
#define debug(x) cerr<<#x<<" : "<<x<<endl
using namespace std;
const int N = 300005;
const int inf = 0x3f3f3f3f;
vector<int>a;
int b[N],s[N];
typedef pair<int,int> PII;
PII add[N],query[N];
int find(int x){
int l=0,r=a.size()-1;
int mid = l + r + 1 >> 1;
while(l<r){
mid = l + r + 1 >> 1;
if(a[mid]<=x){
l = mid;
}
else{
r = mid - 1;
}
}
return l;
}
int main(){
int n,m; cin>>n>>m;
for(int i=1;i<=n;i++){
int x,c;
cin>>x>>c;
add[i]={x,c};
a.push_back(x);
}
for(int i=1;i<=n;i++){
int l,r;
cin>>l>>r;
query[i]={l,r};
a.push_back(l);
a.push_back(r);
}
sort(a.begin(),a.end());
a.erase(unique(a.begin(),a.end()),a.end());
for(int i=1;i<=n;i++){
int p=find(add[i].first);
int c=add[i].second;
b[p]+=c;
}
s[0]=b[0];
for(int i=1;i<=a.size()-1;i++){
s[i]+=s[i-1]+b[i];
}
for(int i=1;i<=m;i++){
int l=find(query[i].first);
int r=find(query[i].second);
cout<<s[r]-s[l-1]<<endl;
}
return 0;
}