离散化
背景
适用范围:数组中元素数值很大,但个数不是很多。
比如将a[]=[1,3,100,2000,500000]映射到[0,1,2,3,4]这个过程就叫离散化。
算法思想
- 本质是一种哈希算法
离散化,就是当我们只关心数据的大小关系时,用排名代替原数据进行处理的一种预处理方法。离散化本质上是一种哈希,它在保持原序列大小关系的前提下把其映射成正整数。当原数据很大或含有负数、小数时,难以表示为数组下标,一些算法和数据结构(如BIT)无法运作,这时我们就可以考虑将其离散化。
离散化的关键问题:
1.a[]中可能有重复元素(去重)
vector<int>alls; //存储所有值
sort(alls.begin(),alls.end()); //将所有值排序
alls.erase(unique(alls.begin(),alls.end()),alls,end()); //去掉重复元素
2.如何算出x离散化后的值(二分),即找到x这个值在a[]中的下标
//二分求出x对应的离散化的值
int find(int x) //找到第一个大于等于x的位置
{
int l=0,r=alls.size()-1;
while(l<r)
{
int mid = l+r >> 1;
if(alls[mid]>=x) r = mid;
else l=mid+1;
}
return r+1; //映射到1,2,...,n
}
算法应用区间和
https://www.acwing.com/problem/content/description/804/
想法
- 离散化
- 将值域的点映射到一个 小的数组中。小的数组进行操作
#include<iostream>
#include<vector>
#include<algorithm>
using namespace std;
typedef pair<int,int>PII;
const int N = 300010;
int n,m;
int a[N],s[N];
vector<int>alls;
vector<PII>add,query;
int find(int x)
{
int l=0,r=alls.size()-1;
while(l<r)
{
int mid = l+r >> 1;
if(alls[mid]>=x) r=mid;
else l=mid+1;
}
return l+1;
}
vector<int>::iterator unique(vector<int> &a)
{
int j=0;
for(int i=0;i<a.size();i++)
if(!i || a[i] != a[i-1])
a[j++] = a[i];
//a[0]~a[j-1]所有a中不重复的数
return a.begin()+j;
}
int main()
{
cin>>n>>m;
for(int i=0;i<n;i++)
{
int x,c;
cin >> x >> c;
add.push_back({x,c});
alls.push_back(x);
}
for(int i=0;i<m;i++)
{
int l,r;
cin >> l >> r;
query.push_back({l,r});
alls.push_back(l);
alls.push_back(r);
}
sort(alls.begin(),alls.end());
alls.erase(unique(alls),alls.end());
for(auto item : add)
{
int x = find(item.first);
a[x] += item.second;
}
for(int i=1;i<=alls.size();i++) s[i] = s[i-1] + a[i];
for(auto item : query)
{
int l=find(item.first),r = find(item.second);
cout<<s[r]-s[l-1]<<endl;
}
return 0;
}