离散化
离散化适用于在一个较大区间内,只关心数据的相对大小,而不关心数据的绝对大小,通常将较大的区间通过映射缩小到一个较小区间中,用相对值代替绝对值,进行缩小区间范围的技巧,以提升时空效率。哈希表本质上就是利用了离散化的思想。
离散化只是一个思想,实际上并没有规定如何进行离散化。离散化的可行方式有:
- 根据数据大小进行离散化,这是最常见的离散化方式
- 根据数据下标进行离散化(典例:用最长不上升子序列求解 L I S LIS LIS)
下面以根据数据大小离散化为例。
例:{1409,1628,201,1816,1024,108}->{4,5,2,6,3,1}
算法流程:
设原序列为 v 1 v1 v1,定义映射序列 v 2 v2 v2,且通过获取 v 1 v1 v1时已在线将 v 2 v2 v2复制完毕。
- 排序:将映射序列 v 2 v2 v2排序,以确定元素相对大小
- 去重:对映射序列 v 2 v2 v2进行去重
- 映射:对映射序列 v 2 v2 v2开始映射,从1开始逐个赋值
- 归位:将映射序列 v 2 v2 v2归位到原序列 v 1 v1 v1中。由于离散化后的序列是有序的,因此可采用二分加速
extern vector<int>v1;
extern vector<pair<int,int>>v2;
bool cmp(pair<int,int>a,int b){
return a.first<b;
}
void fun(){
sort(v2.begin(),v2.end());
v2.erase(unique(v2.begin(),v2.end()),v2.end());
for(int i=0;i<v2.size();i++) v2[i].second=i+1;
for(auto &i:v1) i=lower_bound(v2.begin(),v2.end(),i,cmp)->second;
}