第四章 No.1树状数组的原理与使用

最新推荐文章于 2024-10-06 20:10:02 发布

宇宙第一乌龟骑士

最新推荐文章于 2024-10-06 20:10:02 发布

阅读量268

点赞数

分类专栏： AcWing算法提高课课程记录文章标签：算法开发语言 c++

本文链接：https://blog.csdn.net/weixin_61432764/article/details/131992383

版权

AcWing算法提高课课程记录专栏收录该内容

16 篇文章 2 订阅

订阅专栏

文章目录

线段树的反面：树状数组原理复杂，实现简单

应用问题

支持两个操作：快速求前缀和任意地修改某个数，时间复杂度为 $O (l o g n)$
用前缀和数组，求前缀和的复杂度为 $O (1)$ ，但是任意修改某个数的复杂度为 $O (n)$
用数组，求前缀和的复杂度为 $O (n)$ ，修改某个数的时间复杂度为 $O (1)$

而使用树状数组，可以以适中的时间复杂度解决以上问题

原理

原理就是二进制表示，一个整数x，将其二进制表示后，可以直观地发现该数可以表示成多个2的幂相加
比如10110可以表示成： $2^1+2^2+2^4$
在最坏情况下，一个32位整数n需要将32个2的幂相加，即 $O (l o g n)$

分析一下：将1~x整个区间划分后，每个子区间是怎样的？

每一个区间长度都为2的幂
第一个区间为 $x-2^{i_1}, x]$ ，长度为 $2^{i_1}$
第二个区间为 $x-2^{i_1}-2^{i_2}, x-2^{i_1}]$ ，长度为 $2^{i_2}$
…
最后一个区间为 $0, x-2^{i_1}-2^{i_2}-...-2^{i_{k-1}}]$ ，长度为 $2^{i_k}$
其中k为x中1的个数

可以发现，区间 $(l, r]$ 可以表示成 $[r - l o w bi t (r) + 1, r]$
因为区间长度一定是r的最后一位1对应的幂，即lowbit(r)

假设数组长度为n，对于1~n之间的所有数，将其作为区间 $[r - l o w bi t (r) + 1, r]$ 的右端点，则这些区间将有重复地覆盖1~n整个区间
长度为16的数组的划分：

思考每个区间之间的关系，当前区间可以由哪些区间得到？则有：

将每段区间看成节点，再看上面这张图
连接了存在关系的区间，那么所有区间就构成了一颗树。这便是树状数组名字的由来，十分的形象，思考父子节点之间的关系

对于 $C_{16}$ 这个区间，它由 $a_{16}, C_{15}, C_{14}, C_{12}, C_{8})$ 组成，再举例几个区间后
可以看出规律：区间 $C_n$ 由区间 $a_n, C...)$ 组成，其中除了 $a_n$ ，剩下区间的下标k加上lowbit(k)后的结果为16
15：01111 + 1 = 10000，01111 - 1 = 01110
14：01110 + 10 = 10000，01110 - 10 = 01100
12：01100 + 100 = 10000，01100 - 100 = 01000
8：01000 + 1000 = 10000，01000 - 1000 = 00000
观察这些下标k的规律，每次下标变小都是减去了lowbit(k)，当下标为0，说明当前节点没有子节点了

通过以上推导，可以发现子节点下标到父节点下标的规律：
假设当前区间为 $C_x$ ，那么 $C_{x+lowbit(x)}$ 是其父节点， $C_{x+lowbit(lowbit(x))}$ 是其祖父节点…直到下标超过n。此时作为 $C_x$ 的祖先节点不存在
为什么要知道子节点到父节点的关系？由于 $C_x$ 维护着数组中的某段区间和，并且这些区间之间存在着重叠，修改数组中的任意一个数后，必定会向上影响其的父节点的区间和，此时只能通过子节点不断地更新到根节点，才能维护正确的数据。所以知道子节点到父节点的关系是有必要的

总结一下：
子节点到父节点的推导：假设子节点在数组中的下标为x，需要不断地对子节点的下标加上lowbit(x)，获取其父节点的下标直到下标超过数组长度的最大值
由此就能实现修改任意位置的成员

// 对原数组x下标位置上的数+c
void add(int x, int c)
{
	for (int i = x; i <= n; i += lowbit(i)) tr[i] += c;
}

其中tr数组是维护的树状数组

第二个问题：如何获取前缀和？

还是这张图，假设要获取前16个数的和，直接返回树状数组的 $C_{16}$ 即可，也就是树状数组的第16个成员
假设要获取前14个数的和，需要返回 $C_{14}+C_{12}+C_8$ ，将它们的下标转换成二进制
001110
001100
001000
000000
可以发现，在整个数为0之前，二进制表示的最后一个1不断被减去
经过归纳，求前i个数的和时，需要对树状数组中的数进行累加，这些数的下标从i开始，不断地减去最后一位1，直到i为0
注意不要先减去1再不断减去lowbit(k)，那是求节点的子节点方式
直接减去lowbit(k)是求前缀和的方式

int sum(int x)
{
	int res = 0;
	for (int i = x; i; i -= lowbit(i)) res += tr[i];
	return res;
}

如何建立数组数组？
建立树状数组的方式有两种，最简单的方式是直接调用add将需要修改的数添加（一开始树状数组的所有成员为0），时间复杂度为 $O (n l o g n)$

此外，还能直接根据定义建数组，先求出原数组a[n]的前缀和数组s[n]
树状数组中，区间 $(r - l o w bi t (r) + 1, r)$ 的值为s[r] - s[r - lowbit[r]]，此时直接修改原数组即可
由于不用调用add，所以时间复杂度为 $O (n)$ ，但该做法额外维护了一个前缀和数组

树状数组练习题

241. 楼兰图腾

241. 楼兰图腾 - AcWing题库

划分所有的纵坐标成k个集合，每个集合表示纵坐标为 $y_k$ 时，能构成的v和∧的数量
$x, y_k)$ 能构成的v的数量：在横坐标小于x的坐标中，纵坐标大于 $y_k$ 的坐标数量乘以横坐标大于x的坐标中，纵坐标大于 $y_k$ 的坐标数量
$x, y_k)$ 能构成的∧的数量：在横坐标小于x的坐标中，纵坐标小于 $y_k$ 的坐标数量乘以横坐标大于x的坐标中，纵坐标小于 $y_k$ 的坐标数量

树状数组存储纵坐标小于等于当前下标的坐标数量，比如tr[i]表示纵坐标小于等于i的坐标数量
将所有纵坐标按照横坐标的升序顺序存储到数组a中，遍历a[i]时，需要求出纵坐标小于a[i]以及纵坐标大于a[i]的坐标数量，分别用l数组和g数组存储。这是横坐标小于x且纵坐标大于或小于a[i]的坐标数量，也就是前缀和
a[i]的前缀和求完后，需要将tr[a[i]]加1，表示纵坐标小于等于a[i]的坐标数量+1
前缀和求完后再求后缀和，便能得到答案

tr[i]存储纵坐标小于等于a[i]的坐标数量，如何求纵坐标小于a[i]的坐标数量？tr[a[i]-1]即可
如何求纵坐标大于a[i]的坐标数量，tr[max] - tr[a[i]]即可，max表示所有纵坐标中的最大值

#include <iostream>
#include <cstring>
using namespace std;

typedef long long LL;
const int N = 2e5 + 10;
int a[N], l[N], g[N], tr[N];
int n;

int lowbit(int x)
{
    return x & (~x + 1);
}

int sum(int x)
{
    int res = 0;
    for (int i = x; i; i -= lowbit(i)) res += tr[i];
    return res;
}

void add(int x, int c)
{
    for (int i = x; i <= n; i += lowbit(i)) tr[i] += c;
}

int main()
{
    scanf("%d", &n);
    for (int i = 1; i <= n; ++ i ) scanf("%d", &a[i]);
    
    for (int i = 1; i <= n; ++ i )
    {
        int y = a[i];
        g[i] = sum(n) - sum(y);
        l[i] = sum(y - 1);
        add(y, 1);
    }
    
    LL res1 = 0, res2 = 0;
    memset(tr, 0, sizeof(tr));
    for (int i = n; i >= 1; -- i )
    {
        int y = a[i];
        res1 += g[i] * (LL)(sum(n) - sum(y));
        res2 += l[i] * (LL)sum(y - 1);
        add(y, 1);
    }
    
    printf("%lld %lld\n", res1, res2);
    
    return 0;
}

242. 一个简单的整数问题

242. 一个简单的整数问题 - AcWing题库

将某段区间中的数加上c，而不是修改成c，使用差分数组可以完美解决此问题
查询原数组中某个数的值，使用差分数组需用 $O (n)$ ，总的复杂度为 $O (nm)$ ，可能会超时，所以考虑如何优化

通过差分数组求原数组的某个数其实是一个前缀和操作，要优化 $O (n)$ 的前缀和可以考虑树状数组。自然地，树状数组存储的是原数组的差分信息，1. 将区间 $[l, r]$ 加上c时，只用修改 $l$ 和 $r + 1$ 位置上的数即可，复杂度为 $O (l o g n)$ 2. 求原数组的某个数时，使用树状数组的sum操作即可，时间复杂度为 $O (l o g n)$
总的时间复杂度为 $O (m l o g n)$ ，不会超时

#include <iostream>
using namespace std;

typedef long long LL;
const int N = 1e5 + 10;
int a[N], tr[N];
int n, m;

int lowbit(int x)
{
    return x & (~x + 1);
}

void add(int x, int c)
{
    for (int i = x; i <= n; i += lowbit(i)) tr[i] += c;
}

LL sum(int x)
{
    LL res = 0;
    for (int i = x; i; i -= lowbit(i)) res += tr[i];
    return res;
}

int main()
{
    scanf("%d%d", &n, &m);
    for (int i = 1; i <= n; ++ i )  scanf("%d", &a[i]);

    for (int i = 1; i <= n; ++ i ) tr[i] = a[i] - a[i - lowbit(i)];
    
    int l, r, d, x; char op[2];
    while (m -- )
    {
        scanf("%s", op);
        if (op[0] == 'C') 
        {
            scanf("%d%d%d", &l, &r, &d);
            add(l, d); add(r + 1, -d);
        }
        else
        {
            scanf("%d", &x);
            printf("%lld\n", sum(x));
        }
    }
    return 0;
}

debug：add(l, d); add(r + 1, -d)，后面那个add习惯地写成了add(r + 1, d)
以及可能存在的爆int问题，一直都没有特别注意

243. 一个简单的整数问题2

243. 一个简单的整数问题2 - AcWing题库

需要实现两个操作：1. 对区间中的所有数加上一个数 2. 求区间和
与上题思路类似，保存差分信息以实现第一个操作
求区间和时，思考如何求原数组中的某个数 $a_i$ ？这需要对差分数组前缀求和
那么如何求原数组中的区间和呢？分别求出区间中的每个数吗？就算对前缀和求解过程进行优化，也要 $O (n)$

思考如何优化对n个数求前缀和？如下图，列出 $a [1]$ 到 $a [x]$ 中的每个数需要的差分信息，补全这些差分信息（图中红蓝部分）

可以发现区间 $(1, x)$ 的和就是蓝色部分，等于所有的和减去红色的和
$b_1+b_2+...+b_x)(x+1)-(1b_1+2b_2+...+xb_x)$
就是 $b_i$ 的前缀和乘以 $(x + 1)$ 再减去 $ib_i$ 的前缀和
$b_i$ 的前缀和可以通过树状数组tr1维护， $ib_i$ 的前缀和可以通过树状数组tr2维护
对于题目需要的两个操作，维护这两个数组可以实现第二个操作，同时tr1数组能实现第一个操作

#include <iostream>
using namespace std;

typedef long long LL;
const int N = 1e5 + 10;

LL tr1[N], tr2[N];
int a[N];
int n, m;

int lowbit(int x)
{
    return x & (~x + 1);
}

void add(LL tr[], int x, LL c)
{
    for (int i = x; i <= n; i += lowbit(i) ) tr[i] += c;
}

LL sum(LL tr[], int x)
{
    LL res = 0;
    for (int i = x; i; i-= lowbit(i) ) res += tr[i];
    return res;
}

LL prefix_sum(int x)
{
    return (x + 1) * sum(tr1, x) - sum(tr2, x);
}

int main()
{
    scanf("%d%d", &n, &m);
    for (int i = 1; i <= n; ++ i ) scanf("%d", &a[i]);
    for (int i = 1; i <= n; ++ i ) 
    {
        LL b = a[i] - a[i - 1];
        add(tr1, i, b);
        add(tr2, i, b * i);
    }
    
    char op[2]; LL l, r, d;
    while (m -- )
    {
        scanf("%s%lld%lld", op, &l, &r);
        if (op[0] == 'C')
        {
            scanf("%lld", &d);
            add(tr1, l, d), add(tr1, r + 1, -d);
            add(tr2, l, l * d), add(tr2, r + 1, (r + 1) * -d);
        }
        else
        {
            printf("%lld\n", prefix_sum(r) - prefix_sum(l - 1));
        }
    }
    
    return 0;
}

debug：总是习惯LL用%d读取

244. 谜一样的牛

244. 谜一样的牛 - AcWing题库

从最后一个数开始往前推，若 $a_n$ 为 $k$ ，说明前面有k头身高低于第n头牛的牛，此时 $a_n$ 为所有身高中第 $k + 1$ 小的数，将该身高删除，因为每头牛的身高不同
若 $a_i$ 为 $k$ ，说明 $a_i$ 为剩下的身高中第 $k + 1$ 小的数

综上，需要实现两个操作：1. 删除某个身高 2. 计算身高中第 $k$ 小的数
除了平衡树，树状数组也能实现这两个操作
因为每头牛的身高不同，所以1~n中的每个数只能使用一次，将数组 $b [n]$ 的所有成员初始化成1，表示每个身高都没有使用过。一旦使用了某个身高，对应位置上的成员-1，由此可以实现第一个操作
用树状数组维护 $b [n]$ 数组的前缀和，如何计算数组中第k小的身高？若sum(x) = i说明小于等于x的身高中，有i个升高没有被使用
只要找到第一个满足sum(x) = k的x即可，此时的x就是剩下身高中第k小的身高，这个用二分可以实现

#include <iostream>
using namespace std;

const int N = 1e5 + 10;
int n, a[N], tr[N], ans[N];

int lowbit(int x)
{
    return x & (~x + 1);
}

void add(int x, int c)
{
    for (int i = x; i <= n; i += lowbit(i) ) tr[i] += c; 
}

int sum(int x)
{
    int res = 0;
    for (int i = x; i; i -= lowbit(i)) res += tr[i];
    return res;
}

int find(int x)
{
    int l = 1, r = n;
    while (l < r)
    {
        int mid = l + r >> 1;
        if (sum(mid) >= x) r = mid;
        else l = mid + 1;
    }
    return l;
}

int main()
{
    scanf("%d", &n);
    for (int i = 1; i <= n; ++ i ) 
    {
        if (i > 1) scanf("%d", &a[i]);
        add(i, 1);
    }
    
    for (int i = n; i; -- i ) 
    {
        ans[i] = find(a[i] + 1); // sum(mid) <= x
        add(ans[i], -1);
    }
    
    for (int i = 1; i <= n; ++ i ) printf("%d\n", ans[i]);
    
    return 0;
}