算法 -- 离散化

本文介绍了离散化的核心思想,即如何将数据映射到数组下标以处理数据值范围大但数组范围有限的情况,通过例题展示了如何使用二分查找实现离散化,以及在区间和问题中的具体应用,包括存储、排序和查询操作。
摘要由CSDN通过智能技术生成

离散化

为什么要离散化?
因为数据值的范围远大于维护数组的范围,而此时需要却需要数据所对应的下标,即需要将数据映射到数组下标上。
核心思想:
将数据映射到数组下标。

该如何映射呢?

存储当前数据,当前数据所对应的下标就为离散化后的结果

例题

AcWing 802. 区间和

代码:

# 找到原来下标所映射后的结果  即原来下标在数组中的下标
def find(x):
    global subscript
    # 找到x,返回x的下标
    # 采用二分查找
    l, r = 0, len(subscript) - 1
    while l < r:
        mid = l + r >> 1
        if subscript[mid] >= x:
            r = mid
        else:
            l = mid + 1
    return r + 1 # 离散化后的下标从1开始

n, m = map(int, input().split())
# 存储数轴下标 x 和 加的数 c
xc = []
subscript = set() # 存储数轴下标x,并去重,用于进行离散化映射 subscript:下标
for i in range(n):
    x, c = map(int, input().split())
    xc.append([x, c]) #存储后,如何向下标为x的数加c呢。此时需要考虑x的值太大,需要离散化,进行映射, 所以需要对下标x进行单独处理,进行映射
    subscript.add(x)
# 存储区间l和r,l,r也为数组下标,所以也需要存储
lr = []
for j in range(m):
    l, r = map(int, input().split())
    lr.append([l, r])
    subscript.add(l)
    subscript.add(r)
# 需要对这些下标进行离散化,确保每个数据的范围在1e5之内,但是此时下标数组内可能有多个相同的下标,所以需要进行去重
# 进行排序,确保他们之前的大小关系是对应的
# 这个过程其实就是离散化的过程,原来的下标  离散化后   其实对应的是现在的下标
subscript = sorted(subscript)  # 排序


# 新的数轴
a = [0] * 300010
# 执行插入操作
for i in xc:
    # 用之前的下标找到离散化后的下标
    x = find(i[0])
    a[x] += i[1]

# 存储前缀和
s = [0] * 300010
for i in range(1, len(subscript) + 1):
    s[i] = s[i - 1] + a[i]

# 查询区间l, r 
for i in lr:
    l = find(i[0])
    r = find(i[1])
    print(s[r] - s[l - 1])
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值