离散化
为什么要离散化?
因为数据值的范围远大于维护数组的范围,而此时需要却需要数据所对应的下标,即需要将数据映射到数组下标上。
核心思想:
将数据映射到数组下标。
该如何映射呢?
存储当前数据,当前数据所对应的下标就为离散化后的结果
例题
代码:
# 找到原来下标所映射后的结果 即原来下标在数组中的下标
def find(x):
global subscript
# 找到x,返回x的下标
# 采用二分查找
l, r = 0, len(subscript) - 1
while l < r:
mid = l + r >> 1
if subscript[mid] >= x:
r = mid
else:
l = mid + 1
return r + 1 # 离散化后的下标从1开始
n, m = map(int, input().split())
# 存储数轴下标 x 和 加的数 c
xc = []
subscript = set() # 存储数轴下标x,并去重,用于进行离散化映射 subscript:下标
for i in range(n):
x, c = map(int, input().split())
xc.append([x, c]) #存储后,如何向下标为x的数加c呢。此时需要考虑x的值太大,需要离散化,进行映射, 所以需要对下标x进行单独处理,进行映射
subscript.add(x)
# 存储区间l和r,l,r也为数组下标,所以也需要存储
lr = []
for j in range(m):
l, r = map(int, input().split())
lr.append([l, r])
subscript.add(l)
subscript.add(r)
# 需要对这些下标进行离散化,确保每个数据的范围在1e5之内,但是此时下标数组内可能有多个相同的下标,所以需要进行去重
# 进行排序,确保他们之前的大小关系是对应的
# 这个过程其实就是离散化的过程,原来的下标 离散化后 其实对应的是现在的下标
subscript = sorted(subscript) # 排序
# 新的数轴
a = [0] * 300010
# 执行插入操作
for i in xc:
# 用之前的下标找到离散化后的下标
x = find(i[0])
a[x] += i[1]
# 存储前缀和
s = [0] * 300010
for i in range(1, len(subscript) + 1):
s[i] = s[i - 1] + a[i]
# 查询区间l, r
for i in lr:
l = find(i[0])
r = find(i[1])
print(s[r] - s[l - 1])