什么是离散化:
离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。
再通俗一点:
离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。
概述:
离散化是程序设计中一个常用的技巧,它可以有效的降低时间复杂度。其基本思想就是在众多可能的情况中,只考虑需要用的值。离散化可以改进一个低效的算法,甚至实现根本不可能实现的算法。要掌握这个思想,必须从大量的题目中理解此方法的特点。例如,在建造线段树空间不够的情况下,可以考虑离散化。
举几个例子:
原数据:1,999,100000,15;处理后:1,3,4,2;
原数据:{100,200},{20,50000},{1,400};
处理后:{3,4},{2,6},{1,5};
什么时候可以用离散化:
当数据只与它们之间的相对大小有关,而与具体是多少无关时,可以进行离散化。
从上面的例子我们也可以看出,离散化就是使离散的点(差距很大的数值)转换成更加紧密的点。(也即数组下标)这样就可以极大的缩小空间复杂度和时间复杂度,且不改变原来的属性。即我原来比你大,离散化后仍然比你大,只不过差距变小了而已。
常见的离散化:
第一种:原来相等的值离散化后仍然相等。那么在对原序列进行排序后,进行去重操作即可。这个操作并不需要我们来实现,C++ <algorithm>库中的unique可以帮我们完成,具体看代码。去重之后呢,利用upper_bound或lower_bound函数就可以完成从值到下标的离散化了,这里两个函数都用一下,让大家感受一下区别。(排序和去重是对原序列的副本进行的操作 最后离散化修改的才是原序列 对于lower_bound和upper_bound的简要介绍:https://blog.csdn.net/xiji333/article/details/87627628)
(这个例子中 n=5 5个数分别为:1099 99 1099 1 10000)
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
int n; //原序列长度
int a[1005];//原序列
int len; //去重后的序列长度
int f[1005];//原序列的副本
int main()
{
scanf("%d",&n);
for(int i=0;i<n;i++)
{
scanf("%d",&a[i]);
f[i]=a[i];
}
sort(f,f+n);//排序
for(int i=0;i<n;i++)
printf("%-4d ",a[i]);
printf("\n");
len=unique(f,f+n)-f;//去重后的序列长度
for(int i=0;i<n;i++) //离散化
a[i]=lower_bound(f,f+len,a[i])-f;
for(int i=0;i<n;i++)//用lower_bound 离散化后的结果
printf("%-4d ",a[i]);
printf("\n");
for(int i=0;i<n;i++)
f[i]=a[i];
sort(f,f+n);
len=unique(f,f+n)-f;
for(int i=0;i<n;i++) //离散化
a[i]=upper_bound(f,f+len,a[i])-f;
for(int i=0;i<n;i++)//用upper_bound 离散化后的结果
printf("%-4d ",a[i]);
printf("\n");
return 0;
}
运行结果为:
我们可以清楚的看到原序列经过离散化后的结果。(其实就是变成了数组下标 只不过相对大小关系不变)那lower_bound和upper_buond的区别呢?假设去重后的序列的长度为len,lower_bound离散化后的结果是0-len-1,而upper_bound离散化后的结果是1-len。
第二种:原来相等的值,离散化后不相等。那不进行去重操作就好了,但是要新增一个id属性,大家看代码和运行结果可以体会一下id的作用。(鉴于upper_bound和lower_bound的区别上面已经演示过了 这里就不再赘述了)
(用的数据同上 n=5 1099 99 1099 1 10000)
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
struct node
{
int val,id;
bool operator < (const node &a)const//重载小于运算符用来排序
{
return val<a.val; //值小的在前面
}
};
int n; //序列长度
node a[1005];//原序列
int f[1005];//离散化后的序列
int main()
{
scanf("%d",&n);
for(int i=0;i<n;i++)
{
scanf("%d",&a[i]);
a[i].id=i+1;
}
sort(a,a+n);
for(int i=0;i<n;i++)
f[a[i].id]=i+1;
for(int i=0;i<n;i++)
printf("%-5d",a[i].id);
printf("\n");
for(int i=0;i<n;i++)
printf("%-5d",a[i].val);
printf("\n");
for(int i=0;i<n;i++)
printf("%-5d",f[a[i].id]);
printf("\n");
return 0;
}
运行结果:
我们可以看到:1->1、99->2、1099->3、1099->4,10000->5,通过id这个属性我们可以直接从序列f中得到离散化后的值。(据说这种离散化方法不常用 就了解一下吧)