动态开点线段树说明
作者:Grey
原文地址:
说明
针对普通线段树,参考使用线段树解决数组任意区间元素修改问题
在普通线段树中,线段树在预处理的时候,需要申请 4 倍大小的数组空间来存放划分的区域,
而本文介绍的动态开点线段树,它和普通线段树的区别是,动态开点线段树不需要像普通线段树那样提前申请 4 倍大小的数据空间来存放划分区域,等到实际使用的时候,再来申请。
先讲一种比较简单的动态开点线段树,这种线段树只支持单点的更新和查询。
即支持如下两个方法
void add(i, v);
该方法表示在 i 上的值加上 v;
int query(int s, int e)
该方法用于获取 s 到 e 区间内的累加和信息。
该线段树只需要定义一个节点数据结构即可
public static class Node {
public int sum;
public Node left;
public Node right;
}
其中 sum 表示 Node 所在区间的累加和,left 表示节点左孩子信息,right 表示节点右孩子信息。
线段树初始化过程也只需要
public static class DynamicSegmentTree {
public Node root;
public int size;
public DynamicSegmentTree(int max) {
root = new Node();
size = max;
}
}
size 表示线段树支持的范围,这个范围从线段树一开始初始化的时候设定好(编号1 到 编号size就是区间范围)。和普通线段树不一样的地方在于,节点只建立了 root 节点,未初始化所有区间。
接下来看add
方法,
public void add(int i, int v) {
add(root, 1, size, i, v);
}
这个方法调用了线段树内部的私有add
方法,
// c-> cur 当前节点!表达的范围 l~r
// i位置的数,增加v
// 潜台词!i一定在l~r范围上!
private void add(Node c, int l, int r, int i, int v) {
if (l == r) {
c.sum += v;
} else { // l~r 还可以划分
int mid = (l + r) / 2;
if (i <= mid) { // l ~ mid
if (c.left == null) {
c.left = new Node();
}
add(c.left, l, mid, i, v);
} else { // mid + 1 ~ r
if (c.right == null) {
c.right = new Node();
}
add(c.right, mid + 1, r, i, v);
}
c.sum = (c.left != null ? c.left.sum : 0) + (c.right != null ? c.right.sum : 0);
}
}
这个add
方法的几个参数分别代表
c : 表示 add 操作的区间代表节点是多少
l…r 表示任务区间,由于初始化 size,所以在调用公开的 add 方法时候,l = 1, r = size,表示在初始化区间范围内操作。
i:表示要操作的位置
v: 表示要增加的值
整个 add 私有方法逻辑也比较简单,核心代码
// i 在节点左边
if (i <= mid) {
// 如果节点的左树为空,则建立新节点
if (c.left == null) {
c.left = new Node();
}
add(c.left, l, mid, i, v);
} else {
// i 在节点右边
// 如果节点右树为空,则建立新节点
if (c.right == null) {
c.right = new Node();
}
add(c.right, mid + 1, r, i, v);
}
// 最后当前节点要汇聚左右树的结果,之所以要判空是因为左右树可能不需要都建立出来
c.sum = (c.left != null ? c.left.sum : 0) + (c.right != null ? c.right.sum : 0);
查询方法的逻辑也比较简单
public int query(int s, int e) {
return query(root, 1, size, s, e);
}
调用了内部的一个私有 query 方法,
private int query(Node c, int l, int r, int s, int e) {
if (c == null) {
return 0;
}
if (s <= l && r <= e) {
return c.sum;
}
int mid = (l + r) / 2;
if (e <= mid) {
return query(c.left, l, mid, s, e);
} else if (s > mid) {
return query(c.right, mid + 1, r, s, e);
} else {
return query(c.left, l, mid, s, e) + query(c.right, mid + 1, r, s, e);
}
}
}
这个私有方法的几个参数说明如下
c:表示要操作的线段树的代表节点是什么;
l…r 是划分的区间范围
s…e 是任务的区间范围
核心逻辑如下
// 如果任务的区间已经包含了划分的区间,直接返回结果
if (s <= l && r <= e) {
return c.sum;
}
// 否则,去左右区间拿累加和
int mid = (l + r) / 2;
if (e <= mid) {
return query(c.left, l, mid, s, e);
} else if (s > mid) {
return query(c.right, mid + 1, r, s, e);
} else {
// 整合成自己的累加和返回
return query(c.left, l, mid, s, e) + query(c.right, mid + 1, r, s, e);
}
整个支持单点更新的动态线段树的完整代码如下(含对数器代码)
// 只支持单点增加 + 范围查询的动态开点线段树(累加和)
public class Code01_DynamicSegmentTree {
public static class Node {
public int sum;
public Node left;
public Node right;
}
// arr[0] -> 1
// 线段树,从1开始下标!
public static class DynamicSegmentTree {
public Node root;
public int size;
public DynamicSegmentTree(int max) {
root = new Node();
size = max;
}
// 下标i这个位置的数,增加v
public void add(int i, int v) {
add(root, 1, size, i, v);
}
// c-> cur 当前节点!表达的范围 l~r
// i位置的数,增加v
// 潜台词!i一定在l~r范围上!
private void add(Node c, int l, int r, int i, int v) {
if (l == r) {
c.sum += v;
} else { // l~r 还可以划分
int mid = (l + r) / 2;
if (i <= mid) { // l ~ mid
if (c.left == null) {
c.left = new Node();
}
add(c.left, l, mid, i, v);
} else { // mid + 1 ~ r
if (c.right == null) {
c.right = new Node();
}
add(c.right, mid + 1, r, i, v);
}
c.sum = (c.left != null ? c.left.sum : 0) + (c.right != null ? c.right.sum : 0);
}
}
// s~e范围的累加和
public int query(int s, int e) {
return query(root, 1, size, s, e);
}
// 当前节点c,表达的范围l~r
// 收到了一个任务,s~e这个任务!
// s~e这个任务,影响了多少l~r范围的数,把答案返回!
private int query(Node c, int l, int r, int s, int e) {
if (c == null) {
return 0;
}
if (s <= l && r <= e) {
return c.sum;
}
int mid = (l + r) / 2;
if (e <= mid) {
return query(c.left, l, mid, s, e);
} else if (s > mid) {
return query(c.right, mid + 1, r, s, e);
} else {
return query(c.left, l, mid, s, e) + query(c.right, mid + 1, r, s, e);
}
}
}
public static class Right {
public int[] arr;
public Right(int size) {
arr = new int[size + 1];
}
public void add(int i, int v) {
arr[i] += v;
}
public int query(int s, int e) {
int sum = 0;
for (int i = s; i <= e; i++) {
sum += arr[i];
}
return sum;
}
}
public static void main(String[] args) {
int size = 10000;
int testTime = 50000;
int value = 500;
DynamicSegmentTree dst = new DynamicSegmentTree(size);
Right right = new Right(size);
System.out.println("测试开始");
for (int k = 0; k < testTime; k++) {
if (Math.random() < 0.5) {
int i = (int) (Math.random() * size) + 1;
int v = (int) (Math.random() * value);
dst.add(i, v);
right.add(i, v);
} else {
int a = (int) (Math.random() * size) + 1;
int b = (int) (Math.random() * size) + 1;
int s = Math.min(a, b);
int e = Math.max(a, b);
int ans1 = dst.query(s, e);
int ans2 = right.query(s, e);
if (ans1 != ans2) {
System.out.println("出错了!");
System.out.println(ans1);
System.out.println(ans2);
}
}
}
System.out.println("测试结束");
}
}
接下来看一个使用动态开点线段树来解决的一个问题
即:LeetCode 315. Count of Smaller Numbers After Self
注:本题可以用归并排序,树状数组,有序表来解,也可以用动态开点线段树来解。
主要思路如下
以如下数组为例来说明
nums = {5,8,7,4,2,9}
首先,初始化一个 List,这个 List 用于存放每个位置的右侧比其小的数有几个,List 的大小和原始数组一样
List<Integer> ans = new ArrayList<>(nums.length);
ans 在初始化的时候,均设置为 0 ,表示,所有位置都还没计算过。
ans = [0,0,0,0,0,0]
接下来对原始数组进行排序(注意:排序的时候,不能只使用值来排序,要带上这个值所在的位置,这样排序后才不会丢失该值在原始数组中的位置信息)
int[][] arr = new int[n][];
for (int i = 0; i < n; i++) {
// 要记录值,也要记录位置,防止排序后找不到值对应的位置在哪里
arr[i] = new int[] {nums[i], i};
}
// 排序按值排序
Arrays.sort(arr, Comparator.comparingInt(a -> a[0]));
排序后,arr 按如下顺序组织
{值:2,原始位置:4}
{值:4,原始位置:3}
{值:5,原始位置:0}
{值:7,原始位置:2}
{值:8,原始位置:1}
{值:9,原始位置:5}
接下来初始化开点线段树,线段树的size就是原始数组的大小,且每个位置都是0,
按顺序遍历这个 arr 数组,最小值 2 被取出,其原始位置是 4,且 4 号位置右侧没有比自己更小的数,接下来在开点线段树中把把 4 号位置的值加1,表示 4 号位置被处理过了,在线段树中查4号位置以后并没有任何标记记录,说明没有比这个数更小的数了,直接设置4号位置的ans值为0
ans = [0,0,0,0,0,0]
线段树中
seg = [0,0,0,0,1,0]
接下来是 3 号位置的4,在线段树中查到,有一个比它小的,直接设置到 ans 中,然后在线段树中把 3 号位置也标记为 1,说明处理过,
ans = [0,0,0,1,0,0]
线段树中
seg = [0,0,0,1,1,0]
接下来是0号位置的5, 在线段树中,查到右侧有两个标记过的,说明有两个比它小的数,直接在 ans 中把 0 号位置设置为 2, 然后在线段树中把 0 号位置标记为 1 ,说明处理过,此时
ans = [2,0,0,1,0,0]
线段树中
seg = [1,0,0,1,1,0]
接下来是 2 号位置的 7, 在线段树中,查到右侧有两个标记过的,说明有两个比它小的数,直接在 ans 中把 2 号位置设置为 2, 然后在线段树中把 2 号位置标记为 1 ,说明处理过,此时
ans = [2,0,2,1,0,0]
线段树中
seg = [1,0,1,1,1,0]
接下来是 1 号位置的 8, 在线段树中,查到右侧有三个标记过的,说明有三个比它小的数,直接在 ans 中把 1 号位置设置为 3, 然后在线段树中把 1 号位置标记为 1 ,说明处理过,此时
ans = [2,3,2,1,0,0]
线段树中
seg = [1,1,1,1,1,0]
接下来是 5 号位置的 9, 在线段树中,查到右侧没有标记过的,说明没有比它小的数,直接在 ans 中把 5 号位置设置为 0, 然后在线段树中把 5 号位置标记为 1 ,说明处理过,此时
ans = [2,3,2,1,0,0]
线段树中
seg = [1,1,1,1,1,1]
以上就是整个流程。
核心代码如下
public static List<Integer> countSmaller(int[] nums) {
if (nums == null || nums.length == 0) {
return new ArrayList<>();
}
int n = nums.length;
List<Integer> ans = new ArrayList<>(n);
for (int i = 0; i < n; i++) {
ans.add(0);
}
int[][] arr = new int[n][];
for (int i = 0; i < n; i++) {
// 要记录值,也要记录位置,防止排序后找不到值对应的位置在哪里
arr[i] = new int[] {nums[i], i};
}
Arrays.sort(arr, Comparator.comparingInt(a -> a[0]));
DynamicSegmentTree dst = new DynamicSegmentTree(n);
for (int[] num : arr) {
ans.set(num[1], dst.query(num[1] + 1, n));
dst.add(num[1] + 1, 1);
}
return ans;
}
其中 DynamicSegmentTree 结构就是前面提到的动态开点线段树的实现。