一、概述:
当一组数据值域太大(例:0~10^9),而数据数量很小(例:10^5)时,值域中的数不是全都用得上的。所以需要用离散化将该组数据映射成数组下标,来用数组表示这组数据,有效降低时间复杂度。
二、思路
例:a[]={1,3,3,100,50000};
- a[]中可能有重复------去重
- 如何算a[i](x)离散化后的值-----二分
三、模板:
vector<int> alls; // 存储所有待离散化的值
sort(alls.begin(), alls.end()); // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end()); // 去掉重复元素
// 二分求出x对应的离散化的值
int find(int x) // 找到第一个大于等于x的位置
{
int l = 0, r = alls.size() - 1;
while (l < r)
{
int mid = l + r >> 1;
if (alls[mid] >= x) r = mid;
else l = mid + 1;
}
return r + 1; // 映射到1, 2, ...n(映射成数组下标)
}
四、例题:区间和
#include<bits/stdc++.h>
using namespace std;
const int N=3*1e5+10;
typedef pair<int,int> PII;
int n,m;
int a[N]; //存的数
int s[N]; //前缀和
//离散化数组
vector<int> alls;
// add存所有插入操作,query存所有查询操作
vector<PII> add,query;
int find(int x)
{
int l=0,r=alls.size()-1;
while(l<r)
{
int mid=l+r>>1;
if(alls[mid]>=x) r=mid;
else l=mid+1;
}
return r+1; //映射的结果是1,2,3……,因为要用前缀和
}
int main()
{
cin>>n>>m;
for(int i=0;i<n;i++)
{
int x,c;
cin>>x>>c;
add.push_back({x,c});
alls.push_back(x);
}
for(int i=0;i<m;i++)
{
int l,r;
cin>>l>>r;
query.push_back({l,r});
alls.push_back(l);
alls.push_back(r); //把需要用到的下标放到alls
}
//去重
sort(alls.begin(),alls.end());
alls.erase(unique(alls.begin(),alls.end()),alls.end());
//处理插入
for(auto item : add)
{
int x=find(item.first);
a[x]+=item.second;
}
//预处理前缀和
for(int i=1;i<=alls.size();i++)
s[i]=s[i-1]+a[i];
//处理询问
for(auto item:query)
{
int l=find(item.first),r=find(item.second);
cout<<s[r]-s[l-1]<<endl;
}
return 0;
}