离散化

最新推荐文章于 2024-03-06 13:43:03 发布

转载最新推荐文章于 2024-03-06 13:43:03 发布 · 410 阅读

编程算法专栏收录该内容

4 篇文章

订阅专栏

本文深入探讨了离散化技术的两种实现方式及其应用场景。离散化是一种将大量数值范围内的数据转换为较小范围的技术，主要用于减少内存消耗并保持数据的相对大小。文章详细介绍了包含重复元素的离散化方法和复杂度较低的离散化方法，通过实例演示了如何使用C++实现这两种方法。

离散化的思想和它的两种代码与区别

2017年06月15日 12:44:41 AC之路有笑有泪阅读数：5804 标签：离散化更多

个人分类：离散化

离散化是什么：一些数字，他们的范围很大（0-1e9），但是个数不算多（1-1e5），并且这些数本身的数字大小不重要，重要的是这些数字之间的相对大小（比如说某个数字是这些数字中的第几小，而与这个数字本身大小没有关系，要的是相对大小）（6 8 9 4 离散化后即为 2 3 4 1）（要理解相对大小的意思）（6在这4个数字中排第二小，那么就把6离散化成2，与数字6本身没有关系， 8,9,4亦是如此）（2018.3.26 对这篇博客进行补充修改，被一道题的离散化卡到了，花了一晚上时间，才找到BUG（需离散化的数字有无相同的数字），黑体字为今晚对此篇博客进行了补充完善与区别）

离散化思想：因为数字太大，导致没有办法开那么大的数组，又因为数字个数并不多，这时候就可以对它们进行离散化，离散化是改变了数字的相对大小，例如，有500000个数字，他们的范围是0-1e9的，这样就满足离散化的条件。

就比如说，你可以开一个5e5的数组，但是你不能开一个1e9的数组。只改变这些数字的相对大小

第一种离散化

（包含重复元素，并且相同元素离散化后也要相同，推荐使用）
离散化以前一直搞不懂是怎么实现的，看了一个代码才明白。

const int maxn=1e5+10;
int a[maxn], t[maxn];
int n;
scanf("%d",&n);
for(int i=1; i<=n; i++)
scanf("%d",a[i]),t[i]=a[i];
sort(t+1,t+n+1);
m=unique(t+1,t+1+n)-t-1;//m为不重复的元素的个数
for(int i=1; i<=n; i++)
a[i]=lower_bound(t+1,t+1+m,a[i])-t;

原来的a[i]离散化后成了后来的a[i]；

离散化后的a[i]范围是（1-m）；
举个栗子：
原序列：6 9 4 6 4
排序后：4 4 6 6 9
unique（元素去掉重复的）后：4 6 9 6 9 （感谢薇亚040214同学提出疑问，为什么unique去重后是4,6,9,6,9，而不是4,6,9,4,9，大家运行下面的代码即可，2018.7.21更）

（SiriusNEO大佬的解答：unique去重完后面的元素是不变的，所以是4 6 9 6 9，具体可以看C++ Reference的源码
http://www.cplusplus.com/reference/algorithm/unique/?kw=unique 2018.8.6更）

#include <cstdio>
#include <algorithm>
using namespace std;
int a[10]={6,9,4,6,4};
int main()
{
int n=5;
sort(a,a+n);//排序后4 4 6 6 9
n=unique(a,a+n)-a;
for(int i=0;i<5;i++)
printf("%d ",a[i]);
printf("\n");
//最后输出4 6 9 6 9
//SiriusNEO大佬的解答：unique去重完后面的元素是不变的，所以是4 6 9 6 9，具体可以看C++ Reference的源码
}

unique有一个返回值，例如有十个有序的数列3 3 5 5 6 6 6 7 7 8，不重复的数字有五个，使用unique去重之后数列变成了3 5 6 7 8 6 6 7 7 8，它只改变了前五个数字后边的不变，返回值是最后一个改变的数字的地址。so：m=unique(t+1,t+1+n)-t-1;一般要减去首地址（t+1），m为不重复的数字的个数

第二种离散化

（复杂度低，1.包含重复元素，并且相同元素离散化后不相同，2.不包含重复元素，并且不同元素离散化后不同，符合这两种的其中一个，推荐使用 | 感谢Angel-Yan同学指出错误，2018.7.21更正）

struct A
{
int x, idx;
bool operator < (const A &rhs) const
{
return x < rhs.x;
}//也可以写个cmp函数排序
};
A a[MAXN];
int rank[MAXN];
int n;
scanf("%d",&n);
for(int i = 1; i <= n; ++i)
{
scanf("%d", &a[i].x);
a[i].idx = i;
}
//for(int i=1; i<=n; i++)
// printf("%d %d\n",a[i].idx,a[i].x);
//printf("\n");
sort(a + 1, a + n + 1);
//for(int i=1; i<=n; i++)
// printf("%d %d\n",a[i].idx,a[i].x);
//printf("\n");
for(int i = 1; i <= n; ++i)
{
rank[a[i].idx] = i;
// printf("rank[%d] = %d\n",a[i].idx,i);
}

给你们个例子：
i 1 2 3 4
x 6 8 9 4
idx 1 2 3 4
排序后：

i 1 2 3 4 //离散化后的数字
x 4 6 8 9
idx 4 1 2 3 //数字原来的所在的位置编号
将上面两行黑体数字对应起来即是：rank[4]=1,rank[1]=2,rank[2]=3,rank[3]=4; //rank[i]=j表示将原来在第i个位置上的数字离散化成j
so:
rank[1]=2;
rank[2]=3;
rank[3]=4;
rank[4]=1;
so: 6 8 9 4