20190509：学校-3-树状数组

最新推荐文章于 2024-10-16 11:00:59 发布

gyro永不抽风

最新推荐文章于 2024-10-16 11:00:59 发布

阅读量123

点赞数

分类专栏：程序文章标签：树状数组数据结构 NOIP 算法 OI

本文链接：https://blog.csdn.net/qq_35663246/article/details/90577582

版权

程序专栏收录该内容

2 篇文章 0 订阅

订阅专栏

树状数组

树状数组的作用：计算一些数据的从1开始计算到 $i$ 位置的和、从1位置到 $i$ 位置的最大值，等。这些运算都必须满足有聚合运算的性质，（满足结合律）。例如，对于求最大值，定义 $a (M) b$ 为求 $a$ 与 $b$ 的最大值，与加法的结合律相同，由结合律存在下式：

$[a (M) b] (M) c = a (M) [b (M) c]$

树状数组是一种数据结构。对于：

$a_1, a_2, a_3, ... ,a_n$

若将其使用树状数组，则会有 $\leq \log n$ 个摊（分组）。
对摊的定义与解释：
- 举一个简单的例子：将7写成二进制：
$7 = (111)_2$

$21 = (10101)_2 = 1*2^4 + 1*2^2 + 1$

7可分为（前4）+（中2）+（后1）。
现在对于 $a_1…a_{21}$ 来说，可以通过同样的编码方法将其分组：

$a_1 + ...a_{21} = (a_1 + ...+a_{16}) + (a_{17} + ...+a_{20}) + (a_{21})$

$T_1: a_1 \rightarrow a_1 \\ T_2: a_1 \rightarrow a_2 \\ T_3: a_3 \rightarrow a_3 \\ T_4: a_1 \rightarrow a_4 \\ T_5: a_5 \rightarrow a_5 \\ T_6: a_5 \rightarrow a_6 \\ T_7: a_7 \rightarrow a_7 \\ T_8: a_1 \rightarrow a_8$

例如，对于 $a_1, … , a_{64}$ 而言，：
- 长度为64的只有一堆：[1, 64]；
- 长度为32的有2，1堆：[1, 32]，~~[33,64]~~；
- 长度为16的有4，2堆：[1, 16]，~~[17, 32]~~，[33, 48]，~~[49, 64]~~；
- 长度为8的有8，4堆：[1, 8]，~~[9, 16]~~，[17, 24]，~~[25, 32]~~，[33, 40]，~~[41, 48]~~，[49, 56]，~~[57, 64]~~；
  
  ……等。
对于末尾重复的区间，删去较小的区间，保留较大的区间，以做到节省的目的。在上面的例子当中，可以发现：区间最末尾的值 $0<t_i\leq n$ ，出现且仅出现一次，所以可以发现，总共存在 $n$ 个区间，所以有 $\leq \log n$ 个分组
在上面的例子当中，每个摊所管的数量可以得到规律：对于每个 $T [i]$ ，其所管的长度为 $l b (i)$
上面的 $l b (i)$ 为“low bit”，为在二进制数当中的最后一个出现的 $1$ 所代表的十进制数，例如：对于12而言， $12 = (1100)_2$ ，则最后一个 $1$ 为 $100)_2 = 4$ ，则 $l b (12) = 4$ 。所以 $T [12]$ 所管理的区间为 $[9, 12]$ 。
同样地，可以总结出：对于每一个 $S [i]$ ，所管的区间为： $[i - l b (i) + 1, i]$ 。
在树状数组当中，计算的时候，采用上述的摊的计算方式。由此结束了计算的时候的解释。
综合上面的叙述可以不难发现：对于 $a_1, a_2, a_3, … ,a_n$ 而言，一共会定义 $n$ 个数组， $T [n]$ ，但是在运算的时候，会根据实际的需要，选取相关分组的运算，使得时间复杂度为 $O(\log n)$ 。
首先，必需要对数组进行初始化（共有 $\leq \log n$ 个分组）：初始化成为目标运算的值，例如加法即为和，求最大值即为各数组的最大值。例如：
```
for (int i = 1; i <= n; i ++) {
    cin >> a[i];
    add(i, a[i]);
}
```
这就是当新的值被添加进来的情况，这等价于将第 $i$ 号为的值由 $0$ 改为 $a_i$ ，时间复杂度为 $\log N$ 。

对数组进行求和的操作

对数组进行修改： $\Delta) \Rightarrow a_i \rightarrow a_i + \Delta$ ：
- 研究对数组进行改动，必须研究改动所带来的牵连影响，研究对 $a_i$ 数据的改动，将影响那些区间的运算结果。
- 再举个简单的例子：若对于数组的第九个元素进行改动，则：
  $\rightarrow t[9] \rightarrow 9 \\ [9, 10] \rightarrow t[10] \rightarrow 9 + lb(9) = 10 \\ [9, 12] \rightarrow t[12] \rightarrow 10 + lb(10) = 12 \\ [1, 16] \rightarrow t[16] \rightarrow 12 + lb(12) = 16$
  - 在这个例子当中，会发现上述的区间都会影响，归纳为 $t_i’ = t_i + lb(i)$ 。
- 可以写成以下代码：
```
void add(int i, int d) {
    while (i <= n) {
        T[i] += d;
        i += lb(i);
    }
}
```
对数组进行查询第 $1 - j$ 个元素之和： $\Rightarrow a_1 + a_2 + … + a_j$ ：
- 再举一个简单的例子：求前23个元素的和：
  $\text{ans} += T[23] \rightarrow [23, 23] \rightarrow 23 \\ \text{ans} += T[22] \rightarrow [21, 22] \rightarrow 23 - lb(23) = 22 \\ \text{ans} += T[20] \rightarrow [16, 20] \rightarrow 22 - lb(22) = 20 \\ \text{ans} += T[16] \rightarrow [1, 16] \rightarrow 20 - lb(20) = 16 \hspace{5pt} \\ 16 - lb(16) = 0$
- 将上述规律归纳成代码：
```
int sum(int i) {
    int ans = 0;
    while (i > 0) {
        ans += T[i];
        i -= lb(i);
    }
    return ans;
}
```

对数组进行最大值的操作：

对数组进行修改： $\Delta) \Rightarrow a_i \rightarrow a_i + \Delta \Rightarrow T[m…n] = \max\{T[m…n] , a[i] + \Delta\}$

同理：
```
void add(int i, int d) {
    while (i <= n) {
        T[i] = max(T[i], a[i] + d);
        i += lb(i);
    }
}
```
对数组进行计算取最值： $\Rightarrow \max\{a_1, a_2, a_3, …, a_j\}$

同理：
```
int max(int i) {
    int ans = 0;
    while (i > 0) {
        ans = max(ans, T[i]);
        i -= lb(i);
    }
}
```

再论 $l b (i)$ ：
- 由于 $l b (i)$ 为 $i$ 转换为二进制后的自后向前数到的第一个 $1$ 和若干个 $0$ 的十进制表示，所以便可以将 $l b (i)$ 的计算成 $i\hspace{5pt} \& \hspace{5pt}(-i)$ 。
- 对于 $- i$ ，计算机会对其进行取反加一的操作（负数以其正值得补码形式表达）。
- 例如对于 $011011000)_2$ 取反： $100100111)_2$ ，再加一得到 $100101000)_2$ 。
- 此时的（位运算） $i$ 与 $- i$ 的与就是 $l b (i)$ 的值。
- 例子：
  $\hspace{5pt}\hspace{5pt}(011011000)_2 \\ \&\hspace{5pt}(100101000)_2 \\ ----------\\ \hspace{5pt}\hspace{5pt}\hspace{5pt}\hspace{5pt}\hspace{5pt}\hspace{5pt}(000001000)_2 = 8$
  则 $lb(216) = lb[(011011000)_2] = 8$
```
int lb(int i) {
    return i & (-i);
}
```
正因为这个特性：可以将某一个二进制数表达为： $\text{ zeros})$ 。

则其的相反数即为： $…01…1(n\text{ ones}) + 1 = …10…0(n\text{ zeros})$ 。将两数取与，则在第 $1 - n$ 为皆为 $\& 1 = 0$ ，在第 $n + 1$ 位为 $1\&1 = 1$ ，其后也皆为 $0$ 。（此处的位数顺序为自后向前）
综上所述，可以发现：使用树状数组，无论是添加元素，修改元素，还是查询某位置的结果，其事件复杂度均相同，为 $\log n$ 。