算法 -- 离散化

@ShiYi

已于 2024-03-22 18:43:19 修改

阅读量172

点赞数 2

分类专栏：算法学习文章标签：算法

于 2024-03-22 18:42:07 首次发布

本文链接：https://blog.csdn.net/m0_71001684/article/details/136945119

版权

算法学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文介绍了离散化的核心思想，即如何将数据映射到数组下标以处理数据值范围大但数组范围有限的情况，通过例题展示了如何使用二分查找实现离散化，以及在区间和问题中的具体应用，包括存储、排序和查询操作。

摘要由CSDN通过智能技术生成

离散化

为什么要离散化？
因为数据值的范围远大于维护数组的范围，而此时需要却需要数据所对应的下标，即需要将数据映射到数组下标上。
核心思想：
将数据映射到数组下标。

该如何映射呢?

存储当前数据，当前数据所对应的下标就为离散化后的结果

例题

AcWing 802. 区间和

代码：

# 找到原来下标所映射后的结果  即原来下标在数组中的下标
def find(x):
    global subscript
    # 找到x，返回x的下标
    # 采用二分查找
    l, r = 0, len(subscript) - 1
    while l < r:
        mid = l + r >> 1
        if subscript[mid] >= x:
            r = mid
        else:
            l = mid + 1
    return r + 1 # 离散化后的下标从1开始

n, m = map(int, input().split())
# 存储数轴下标 x 和 加的数 c
xc = []
subscript = set() # 存储数轴下标x，并去重，用于进行离散化映射 subscript：下标
for i in range(n):
    x, c = map(int, input().split())
    xc.append([x, c]) #存储后，如何向下标为x的数加c呢。此时需要考虑x的值太大，需要离散化，进行映射, 所以需要对下标x进行单独处理，进行映射
    subscript.add(x)
# 存储区间l和r，l，r也为数组下标，所以也需要存储
lr = []
for j in range(m):
    l, r = map(int, input().split())
    lr.append([l, r])
    subscript.add(l)
    subscript.add(r)
# 需要对这些下标进行离散化，确保每个数据的范围在1e5之内，但是此时下标数组内可能有多个相同的下标，所以需要进行去重
# 进行排序，确保他们之前的大小关系是对应的
# 这个过程其实就是离散化的过程，原来的下标  离散化后   其实对应的是现在的下标
subscript = sorted(subscript)  # 排序


# 新的数轴
a = [0] * 300010
# 执行插入操作
for i in xc:
    # 用之前的下标找到离散化后的下标
    x = find(i[0])
    a[x] += i[1]

# 存储前缀和
s = [0] * 300010
for i in range(1, len(subscript) + 1):
    s[i] = s[i - 1] + a[i]

# 查询区间l, r 
for i in lr:
    l = find(i[0])
    r = find(i[1])
    print(s[r] - s[l - 1])

@ShiYi

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
算法 -- 离散化

为什么要离散化？因为数据值的范围远大于维护数组的范围，而此时需要却需要数据所对应的下标，即需要将数据映射到数组下标上。核心思想：将数据映射到数组下标。该如何映射呢?存储当前数据，当前数据所对应的下标就为离散化后的结果。
复制链接

扫一扫