树状数组

最新推荐文章于 2024-03-08 14:43:48 发布

rylq56m9

最新推荐文章于 2024-03-08 14:43:48 发布

阅读量821

点赞数

分类专栏：算法文章标签：树状数组

算法专栏收录该内容

8 篇文章 0 订阅

订阅专栏

转载地址：http://www.cppblog.com/menjitianya/archive/2015/11/02/212171.html

以下内容，虽然转载自他人，但加入了自己的理解并修改了原著中的部分错误，同时完善了内容。

一、从图形学算法说起

1、Median Filter 概述

2、r pixel-Median Filter 算法

3、一维模型

4、数据结构的设计

5、树状数组华丽登场

二、细说树状数组

1、树 or 数组？

2、结点的含义

3、求和操作

4、更新操作

5、lowbit函数O(1)实现

6、小结

三、树状数组的经典模型

1、PUIQ模型

2、IUPQ模型

3、逆序模型

4、二分模型

5、再说Median Filter

6、多维树状数组模型

四、树状数组题集整理

一、从图形学算法说起

1、Median Filter概述

Median Filter 在现代的图形处理中是非常基础并且广泛应用的算法 (翻译叫中值滤波器，为了不让人一看到就觉得是高深的东西，还是选择了使用它的英文名，更加能让人明白是个什么东西) ，如图一-1-1，基本就能猜到这是一个什么样的算法了，可以简单的认为是PS中的"模糊"那个操作。

2、r pixel-Median Filter算法

首先对于一张宽为W，高为H的图片，每个像素点存了一个颜色值，这里为了把问题简化，先讨论黑白图片，黑白图片的每个像素值可以认为是一个[0, 255]的整数（如图一-1-2，为了图片看起来不是那么的密密麻麻，像素值的范围取了[0, 10]）。

r pixel-Median Filter 算法描述如下：

对于每个第i行第j列的像素点p(i, j)，像四周扩展一个宽和高均为(2r + 1)的矩形区域，将矩形区域内的像素值按非降序排列后，用排在最中间的那个数字取代原来的像素点p(i, j)的值( 边界的那圈不作考虑 )，下文会将排在最中间的那个数字称为这个序列的中位数。

图一-1-2

如图一-1-2，r = 1，红框代表(2, 3) (下标从0计数，行优先)这个像素点所选取的2r + 1的矩形区域，将内中数字进行非降序排列后，得到 [0 1 1 2 3 4 6 7 9]，所以(2, 3)这个像素点的值将从 6 变成 3。

这样就可以粗略得到一个时间复杂度为O(n^4 logn )的算法（枚举每个像素点，对于每个像素点取矩形窗口元素排序后取中值）。n代表了图片的尺寸，也就是当图片越大，这个算法的执行效率就越低，而且增长迅速。那么如何将这个算法进行优化呢？如果对于二维的情况不是很容易下手的话，不妨先从一维的情况进行考虑。

3、一维模型

将问题转化成一维，可以描述成：给定 n (n <= 100000)个范围在[0, 255]的数字序列a[i] (1 <= i < = n)和一个值 r (2r+1 <= n)，对于所有的a[k] (r+1 <= k <= n-r)，将它变成 a[k-r ... k+r] 中的中位数。

a[1...7] = [1 7 6 4 3 2 1] r = 2

d[3] = median( [1 7 6 4 3] ) = 4

d[4] = median( [7 6 4 3 2] ) = 4

d[5] = median( [6 4 3 2 1] ) = 3

所以原数组就会变成a[1..7] = [1 7 4 4 3 2 1]

那么总共需要计算的元素为n-2r，取这些元素的左右r个元素的值需要2r+1次操作，(n-2r)*(2r+1) 当r = (n-1)/4 时取得最大值，为 (n+1)^2 / 4，再加上排序的时间复杂度，所以最坏情况的时间复杂度为O( n^2 logn )。n的范围不允许这么高复杂度的算法，尝试进行优化。

考虑第i个元素的2r+1区域 a[ i-r ... i+r ] 和第i+1个元素的2r+1区域 a[ i+1-r ... i+1+r ] ，后者比前者少了一个元素a[i-r]，多了一个元素a[i+1+r]，其它元素都是一样的，那么在计算第i+1个元素的情况时如何利用第i个元素的情况就成了问题的关键。一般做法是删除a[i-r],增加a[i+1+r].然后对得到的更新后的数组排序，找出中位数。

4、数据结构的设计

我们现在假设有这样一种数据结构，可以支持以下三种操作：

1、插入(Insert)，将一个数字插入到该数据结构中；

2、删除(Delete), 将某个数字从该数据结构中删除；

3、询问(Query), 询问该数据结构中存在数字的中位数；

如果这三个操作都能在O( log(n) )或者O(1)的时间内完成，那么这个问题就可以完美解决了。具体做法是：

首先将a[1...2r+1]这些元素都插入到该数据结构中，然后询问中位数，用得到的中位数替换掉a[r+1]，再删除a[1]，插入a[2r+2]，再询问中位数替换掉a[r+2]，以此类推，直到计算完第n-r个元素。所有操作都在O( log(n) ) 时间内完成的话，总的时间复杂度就是O( nlogn )。

4.1 寻找满足条件的数据结构

那么什么样的数据结构可以满足这三条操作都在O( log(n) )的时间内完成呢？

考虑Hash表（线性表）：假设每个数字的范围是[0, 255]，如果我们将这些数字映射到一个HASH表中，插入和删除操作都可以做到O(1)。但是询问操作呢？

此处，用一个辅助数组d[256]，执行d[a[i] ]+=1操作表示插入a[i]，执行 d[a[i] ]-=1操作表示删除a[i]；询问操作是对d数组进行顺序统计，顺序枚举i，找到第一个满足 sum{d[j] | 1 <= j <= i} >= r+1的 i 就是所求中位数，这样就得到了一个时间复杂度为O(Kn)的算法，其中K是数字的值域（这里讨论的问题值域是256）。

询问操作的原理很简单，其实就是通常找中位数算法的trick实现。通常算法:对特定范围(本例 a[1..2r+1])内的的元素排序，然后顺序统计，找到中间的数字，就是中位数。

因此本节的询问操作实质上是以空间换时间的实现。其用辅助数组的index表示a数组中元素的值域，辅助数组的index默认是递增排列的(对应通常算法中的排序操作，但还仍然不能确定中位数),因此用index对应的Element的值表示在a[1..2r+1]范围中每个元素(即index)出现的次数（实质上，用一种映射的方式实现了a[...2r+1]中元素的排序)。

例如对上例来说，辅助数组d初始是

Index 1234 5 67

Element 0000 0 00

插入元素 1，7, 6, 4, 3后，d数组变成

Index 1234 5 67

Element 1011 0 11

注意Index是递增排列的，其代表的是值域中的每个元素，Element对应在数组a中的[1....2r+1]范围内每个元素的个数

因此，只要顺序统计element的和，直到和大于r+1,此时的index就是中位数。在此例中，统计到Index=4时，和值大于2+1(r+1), 因此中位数是4。

相比之前的算法，这种方法已经前进了一大步，至少n的指数下降了大于一个数量级，但是也带来了一个问题，如果数字的值域很大，复杂度还是会很大，所以需要更好的算法支持。

5、树状数组华丽登场

这里引入一种数据结构 - 树状数组 ( Binary Indexed Tree，BIT，二分索引树 )，它只有两种基本操作，并且都是操作线性表的数据的：

1、 add( i, 1 ) (1<=i <=n) 对第i个元素的值自增1 O(logn)

2、 sum( i ) (1<=i<=n) 统计[1...i]元素值的和 O(logn)

试想一下，如果用HASH来实现这两个函数，那么1的复杂度是O(1)，而2的复杂度就是O(n)了，而树状数组实现的这两个函数可以让两者的复杂度都达到O(logn)，具体的实现先卖个关子，留到第二节着重介绍。

有了这两种操作，我们需要将它们转化成之前设计的数据结构的那三种操作，首先：

1、插入(Insert)，对应的是 add(i, 1)，时间复杂度O( logn )

2、删除(Delete), 对应的是 add(i, -1), 时间复杂度O( logn )

3、询问(Query), 由于sum( i )能够统计[1...i]元素值的和，换言之，它能够得到我们之前插入的数据中小于等于i的数的个数，那么如果能够知道sum(i) >= r + 1的最小的i，那这个i就是所有插入数据的中位数了（因为根据上文的条件，插入的数据时刻保证有2r+1个）。因为sum(i)是关于 i 的递增函数，所以基于单调性我们可以二分枚举i (1 <= i <= n)，得到最小的 i 满足sum(i) >= r + 1，每次的询问复杂度就是 O( logn * logn )。一个logn是二分枚举的复杂度，另一个logn是sum 函数的复杂度。

这样一来，一维的Median Filter模型的整体时间复杂度就降到了O(n * logn * logn)，已经是比较高效的算法了。

接下来就是要来说说树状数组的具体实现了。

二、细说树状数组

1、树 or 数组？

名曰树状数组，那么究竟它是树还是数组呢？数组在物理空间上是连续的，而树是通过父子关系关联起来的，而树状数组正是这两种关系的结合，首先在存储空间上它是以数组的形式存储的，即下标连续；其次，对于两个数组下标x，y(x < y)，如果x + 2^k = y (k等于x的二进制表示中末尾0的个数)，那么定义(y, x)为一组树上的父子关系，其中y为父结点，x为子结点。

图二-1-1

如图二-1-1，其中A为普通数组，C为树状数组（C在物理空间上和A一样都是连续存储的）。树状数组的第4个元素C4的父结点为C8 (4的二进制表示为"100"，所以k=2，那么4 + 2^2 = 8)，C6和C7同理。C2和C3的父结点为C4，同样也是可以用上面的关系得出的，那么从定义出发，奇数下标一定是叶子结点。

2、结点的含义

然后我们来看树状数组上的结点Ci具体表示什么，这时候就需要利用树的递归性质了。我们定义Ci的值为它的所有子结点的值和 Ai 的总和，之前提到当i为奇数时Ci一定为叶子结点，所以有Ci = Ai ( i为奇数 )。从图中可以得出：

C1 = A1

C2 = C1 + A2 = A1 + A2

C3 = A3

C4 = C2 + C3 + A4 = A1 + A2 + A3 + A4

C5 = A5

C6 = C5 + A6 = A5 + A6

C7 = A7

C8 = C4 + C6 + C7 + A8 = A1 + A2 + A3 + A4 + A5 + A6 + A7 + A8

建议直接看C8，因为它最具代表性。

我们从中可以发现，其实Ci还有一种更加普适的定义，它表示的其实是一段原数组A的连续区间和。根据定义，右区间是很明显的，一定是i，即Ci表示的区间的最后一个元素一定是Ai，那么接下来就是求Ci表示的左区间。从图上可以很容易的清楚，其实就是顺着Ci的最左儿子一直找直到找到叶子结点，那个叶子结点就是Ci表示的左区间。

更加具体的，如果i的二进制表示为 ABCDE1000，那么它最左边的儿子就是 ABCDE0100，这一步是通过结点父子关系的定义进行逆推得到，并且这条路径可以表示如下：

ABCDE1000 => ABCDE0100 => ABCDE0010 => ABCDE0001

这时候，ABCDE0001已经是叶子结点了，所以它就是Ci能够表示的左区间的下标，我们发现，如果用k来表示i的二进制末尾0的个数，Ci能够表示的A数组的区间的元素个数为2^k ，又因为区间和的最后一个数一定是Ai，所以有如下公式：

Ci = sum{ A[j] | i - 2^k+ 1 <= j <= i } （帮助理解：将Ci的右左区间相减，然后加1，等于2^k）

3、求和操作

明白了Ci的含义后，我们需要通过它来求sum{ A[j] | 1 <= j <= i }，也就是之前提到的sum(i)函数。为了简化问题，用一个函数lowbit(i)来表示2^k ( k等于i的二进制表示中末尾0的个数)。那么：

sum(i) = sum{ A[j] | 1 <= j <= i }

= A[1] + A[2] + ... + A[i]

= A[1] + A[2] + A[i-2^k] + A[i-2^k+1] + ... + A[i]

= A[1] + A[2] + A[i-2^k] + C[i]

= sum(i - 2^k) + C[i]

= sum( i - lowbit(i) ) + C[i]

由于C[i]已知，所以sum(i)可以通过递归求解，递归出口为当i = 0时，返回0。sum(i)函数的函数主体只需要一行代码：

int sum(int x){

return x ? C[x]+ sum( x - lowbit(x)):0;

}

观察 i - lowbit(i)，其实就是将i的二进制表示的最后一个1去掉，最多只有log(i)个1（假设i的二进制表示最多有n位，则i的最大数为(2^n)-1,所以最多有log(2^n-1)个1），所以求sum(n)的最坏时间复杂度为O(logn)。由于递归的时候常数开销比较大，所以一般写成迭代的形式更好。写成迭代代码如下：

    int sum(int x){
        int s =0;
        for(int i = x; i ; i -= lowbit(i)){
            s += c[i];
        }
        return s;    
    }

4、更新操作

更新操作就是之前提到的add(i, 1) 和 add(i, -1)，更加具体得，可以推广到add(i, v)，表示的其实就是 A[i] = A[i] + v。但是我们不能在原数组A上操作，而是要像求和操作一样，在树状数组C上进行操作。

那么其实就是求在Ai改变的时候会影响哪些Ci，看图二-1-1的树形结构就一目了然了，Ai的改变只会影响Ci及其祖先结点，即A5的改变影响的是C5、C6、C8；而A1的改变影响的是C1、C2、C4、C8。

也就是每次add(i, v)，我们只要更新Ci以及它的祖先结点，之前已经讨论过两个结点父子关系是如何建立的，所以给定一个x，一定能够在最多log(n) (这里的n是之前提到的值域) 次内更新完所有x的祖先结点，add(i, v)的主体代码（去除边界判断）也只有一行代码：

void add(int x,int v){

if(x <= n){

C[x]+= v;

add( x + lowbit(i), v );

}

和求和操作类似，递归的时候常数开销比较大，所以一般写成迭代的形式更好。写成迭代形式的代码如下：

void add ( int x , int v ){

for (int i = x ; i < = n ; i + = lowbit ( i ) ) {

C [i] += v;

}

5、lowbit函数O(1)实现

上文提到的两个函数sum(x)和add(x, v)都是用递归实现的，并且都用到了一个函数叫lowbit(x)，表示的是2^k，其中k为x的二进制表示末尾0的个数，那么最简单的实现办法就是通过位运算的右移，循环判断最后一位是0还是1，从而统计末尾0的个数，一旦发现1后统计完毕，计数器保存的值就是k，当然这样的做法总的复杂度为O( logn )，一个32位的整数最多可能进行31次判断（这里讨论整数的情况，所以符号位不算）。

这里介绍一种O(1)的方法计算2^k的方法。

来看一段补码小知识：

清楚补码的表示的可以跳过这一段，计算机中的符号数有三种表示方法，即原码、反码和补码。三种表示方法均有符号位和数值位两部分，符号位都是用0表示“正”，用1表示“负”，而数值位，三种表示方法各不相同。这里只讨论整数补码的情况，在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理；同时，加法和减法也可以统一处理。整数补码的表示分两种：

正数：正数的补码即其二进制表示；

例如一个8位二进制的整数+5，它的补码就是 00000101 （标红的是符号位，0表示"正"，1表示“负”）

负数：负数的补码即将其整数对应的二进制表示所有位取反(包括符号位)后+1；

例如一个8位二进制的整数-5，它的二进制表示是00000101，取反后为11111010，再+1就是1 1111011，这就是它的补码了。

下面的等式可以帮助理解补码在计算机中是如何工作的

+5 + (-5) = 00000101 + 11111011 = 1 00000000 (溢出了!!!) = 0

这里的加法没有将数值位和符号位分开，而是统一作为二进制位进行计算，由于表示的是8进制的整数，所以多出的那个最高位的1会直接舍去，使得结果变成了0，而实际的十进制计算结果也是0，正确。

补码复习完毕，那么来看下下面这个表达式的含义： x & (-x) (其中 x >= 0)

首先进行&运算，我们需要将x和-x都转化成补码，然后再看&之后会发生什么，我们假设 x 的二进制表示的末尾是连续的 k 个 0，令x的二进制表示为 X₀X₁X₂…X_n-2X_{n-1, 则} {X _i = 0 | n-k <= i < n}，这里的X₀表示符号位。

x 的补码就是由三部分组成： (0)( X₁X₂…X_n-k-1)(k个0) 其中 X_n-k-1为1，因为末尾是k个0，如果它为0，那就变成k+1个0了。

_{-x的补码也是由三部分组成： (1)(} Y₁Y₂…Y_n-k-1)(k个0) 其中 Y_{n-k-1为1，其它的}X_i和Y_i相加为1，想想补码是怎么计算的就明白了。

那么 x & (-x) 也就显而易见了，由两部分组成 (1)(k个0) ，表示成十进制为 2^k 啦。

由于&的优先级低于-，所以代码可以这样写：

int lowbit(int x) {

return x & -x;

}
其他二种O(1)解法

算法1：lowBit(x) = x & ~(x-1)

算法2：lowBit(x) = x & (x ^ (x-1))

6、小结

至此，树状数组的基础内容就到此结束了，三个函数就诠释了树状数组的所有内容，并且都只需要一行代码实现，单次操作的时间复杂度为O( log(n) )，空间复杂度为O(n)，所以它是一种性价比非常高的轻量级数据结构。

树状数组解决的基本问题是单点更新，成端求和。上文中的sum(x)求的是[1, x]的和，如果需要求[x, y]的和，只需要求两次sum函数，然后相减得到，即sum(y) - sum(x-1)。

下面一节会通过一些例子来具体阐述树状数组的应用场景。

三. 树状数组的应用的3中类型

1、PUIQ模型

【例题1】一个长度为n(n <= 500000)的元素序列，一开始都为0，现给出三种操作：

1. add x v : 给第x个元素的值加上v； ( a[x] += v )

2. sub x v : 给第x个元素的值减去v； ( a[x] -= v )

3. sum x y：询问第x到第y个元素的和； ( print sum{ a[i] | x <= i <= y } )

这是树状数组最基础的模型，1和2的操作就是对应的单点更新，3的操作就对应了成端求和。

具体得，1和2只要分别调用add(x, v)和add(x, -v), 而3则是输出sum(y) - sum(x-1)的值。

我把这类问题叫做PUIQ模型(Point Update Interval Query点更新，段求和)。

 1 传入数组A[]的长度n，及对A[i]出的修改，传出A[1`````i]处的和
 2   (1): add（i，w） 在数组A[i]加上w
 3   (2): sum（i） 求A[1````i]的和
 4  
 5   #define lowbit(x) ((x)&(-(x))) 
 6   const int Max = 50005;
 7   
 8   int n, ar[Max];
 9    
10   void add(int i, int w){   
11       while(i <= n){
12           ar[i] += w;
13           i += lowbit(i);
14       }
15   }
16    
17   int sum(int i){          
18       int ans = 0;
19       while(i > 0){
20           ans += ar[i];
21           i -= lowbit(i);
22       }
23       return ans;
24   }
25   void init(){
26       memset(ar, 0, sizeof(ar));
27   }

2、IUPQ模型

【例题2】一个长度为n(n <= 500000)的元素序列，一开始都为0，现给出两种操作：

1. add x y v : 给第x个元素到第y个元素之间的所有值都加上v； ( a[i] += v, 其中 x <= i <= y )

2. get x：询问第x个元素的值； ( print a[x] )

这类问题对树状数组稍微进行了一个转化，但是还是可以用add和sum这两个函数来解决，对于操作1我们只需要执行两个操作，即add(x, v)和add(y+1, -v)？；而操作2则是输出sum(x)-sum(x-1)的值。

这样就把区间更新转化成了单点更新，单点求值转化成了区间求和。

我把这类问题叫做IUPQ模型(Interval Update Point Query段更新，点求值)。详解见（区间更新，区间求和模式）

、逆序模型

【例题3】给定一个长度为n(n <= 500000)的排列a[i]，求它的逆序对对数。1 5 2 4 3 的逆序对为(5,2)

朴素算法，枚举任意两个数，判断他们的大小关系进行统计，时间复杂度O(n²) 。不推荐！

来看一个给定n个元素的排列 X₀X₁X₂… X_n-2X_{n-1,对于某个}X_i元素， _{如果想知道以它为"首"的逆序对的对数( 形如(} X_i ) 的逆序对)，就是需要知道 X_i+1… X_n-2X_n-1_{这个子序列中小于}X_i的元素的个数。

那么我们只需要对这个排列从后往前枚举，每次枚举到X_i元素时，执行cnt += sum(X_i -1)，然后再执行add(X_i, 1)，n个元素枚举完毕，得到的cnt值就是我们要求的逆序数了。总的时间复杂度O(nlogn)。

这个模型和之前的区别在于它不是将原数组的下标作为树状数组的下标，而是将元素本身作为树状数组的下标。逆序模型作为树状数组的一个经典思想有着非常广泛的应用。

给定N(N <= 100000)个区间，定义两个区间(Si, Ei)和(Sj, Ej)的 '>' 如下：

如果 Si <= Sj and Ej <= Ei and Ei - Si > Ej - Sj,则

(Si, Ei) > (Sj, Ej)，现在要求对每个区间有多少区间'>'它。

将上述三个关系式化简，可以得到区间i > 区间j 的条件是：区间i 完全覆盖区间j，并且两者不相等。

图三-3-1

对区间进行排序，排序规则为：左端点递增，如果左端点相同，则右端点递减。

然后枚举区间，不断插入区间右端点，因为区间左端点是保持递增的，所以对于某个区间(Si, Ei)，只需要查询树状数组中[Ei, MAX]这一段有多少已经插入的数据，就能知道有多少个区间是比它大的，这里需要注意的是多个区间相等的情况，因为有排序，所以它们在排序后的数组中一定是相邻的，所以在遇到有相等区间的情况，需要"延迟"插入。等下一个不相等区间出现时才把之前保存下来的区间右端点进行插入。插入完毕再进行统计。

这里的插入即add(Ej, 1)，统计则是sum(MAX) - sum(Ei - 1) (其中j < i)。

、二分模型

现在要你来模拟这个神奇的容器的功能。可以抽象成两种操作：

1. put x 向容器中放入一个编号为x的球；

2. query K 询问容器中第K大的那个球，并且将那个球从容器中去除（保证K<容器中球的总数）；

这个问题其实就是一维Median Filter的原型了，只是那个问题的K = r+1，而这里的K是用户输入的一个常量。所谓二分模型就是在求和的过程中，利用求和函数的单调性进行二分枚举。

对于操作1，只是单纯地执行add(x, 1)即可；而对于操作2，我们要看第K大的数满足什么性质，由于这里的数字不会有重复，所以一个显而易见的性质就是一定有K-1个数大于它，（如果数字重复的话，那么至少有K-1个数(含重复的)大于它）假设它的值为x，那么必然满足下面的等式：sum(N) - sum( x ) == K-1，然而，满足这个等式的x可能并不止一个，来看下面的图：

图三-4-1

图三-4-1中灰色的格子表示容器中的球，分别为2、3、7、8，然后我们需要求第3大的球，理论的球编号为3，但是满足上面等式的球的编号为3、4、5、6。所以我们需要再加一个限制条件，即满足上面等式的最小的x。于是我们二分枚举x，当满足sum(N) - sum( x ) <= K-1时，将右区间缩小（说明找的数x偏大，继续往小的找），否则左区间增大(说明找的数x偏小，继续往大的找)，直到找到满足条件的最小的x为止。单次操作的时间复杂度为O( logn * logn )。

、再说Median Filter

基于二分模型的一维Median Filter问题已经圆满解决了，那么最后让我们回到二维的Median Filter问题上来。

图三-5-1

有了一维的基础，对于二维的情况，其实也是一样的，如图三-5-1，图中红色的框为(1, 1)这个像素点的(2r+1)矩形区域，橙色的框则是(1, 2)的，它们的差别其实只是差了两列；同样的，橙色框和黄色框也差了两列，于是，我们可以从左向右枚举，每次将这个矩形框向右推进一格，然后将"离开"框的那一列数据从树状数组中删除，将"进入"框的那一列数据插入到树状数组中，然后统计中位数。

当枚举到右边界时，将矩形框向下推进一格，然后迂回向左，同样按照之前的方案统计中位数，就这样呈蛇字型迂回前进（具体顺序如图所示的红、橙、黄、绿、青、蓝、紫），这样就得到了一个O( n³lognlogn )的算法，比朴素算法下降了一个数量级。

、多维树状数组模型

1. add x y v 在(x, y)加上一个值v；

2. sum x1 y1 x2 y2 统计矩形(x1, y1) - (x2, y2)中的值的和；

2. sum(x, y) 求矩形区域(1, 1) - (x, y)内的值的和，那么(x1,y1)-(x2,y2)区域内的和可以通过四个求和操作获得，即 sum(x2, y2) - sum(x2, y1 - 1) - sum(x1 - 1, y2) + sum(x1 - 1, y1 - 1)。（利用容斥原理的基本思想）

add(x, y, v)和sum(x, y)可以利用二维树状数组实现，二维树状数组可以理解成每个C结点上又是一棵树状数组（可以从二维数组的概念去理解，即数组的每个元素都是一个数组），具体代码如下：

void add(int x,int y,int v){

for(int i = x; i <= n; i += lowbit(i)){

for(int j = y; j <= n; j += lowbit(j)){

c[i][j]+= v;

}

int sum(int x,int y){

int s =0;

for(int i = x; i ; i -= lowbit(i)){

for(int j = y; j ; j -= lowbit(j)){

s += c[i][j];

}

return s;

}

7.区间更新，区间查询（其实就是[区间更新点查询模式]的扩展）

转载自：http://www.wonter.net/?p=335

更新

首先我们定义 delta[i] 表示从 i ~ n的数字都增加了delta[i]。这样的话，对于每次更新区间[a, b]，我们只需要令 delta[a] += d，表示：从a到n每个数都增加了d。。但我们其实只需要从a到b每个数都增加d，所以我再令delta[b + 1] -= d，将之前多增加的减掉，这样的话，就相当于从a到b都增加了d。

查询

我们定义a[i]表示原来数列的第i个数，那么对于每次查询[a, b]的和，就是sum(b) – sum(a – 1)，sum(x)表示数列1 ~ x的和。我们求1 ~ x时，delta[1]对他的贡献是x*delta[1]，因为delta[1]是表示从1到n都增加delta[1]。所以sum(x) ＝ a[1] + a[2] + … + a[x] + delta[1] * x + delta[2] * (x – 1) + delta[3] * (x – 2) + … + delta[x] ＝ segma(a[i]) + segma(delta[i] * (x – i + 1)) （1 <= i <= x）＝ segma(a[i]) + segma(delta[i]) * (x + 1) – segma(delta[i] * i) 这样的话，就是三个前缀和累加和了，所以！！！！轮到树状数组出场。。

正文

我们发现a[i]这个数组是不变的，所以我们不管他，直接开个数组不变就好了。 delta[i] 和 delta[i] * i这两个数组会变化，我们可以开两个数组。 c1表示delta[i]，c2表示delta[i] * i 所以上面的更新，根据c1和c2的定义，因为delta[a] += d, delta[b + 1] -= d，所以我们只需要将 c1[a] += d, c1[b + 1] -= d，c2[a] += d * a, c2[b + 1] -= d * (b + 1)，就可以了。查询的话，就只需要求前缀和就好了。以poj 3468为例，AC代码如下：

还有一个空间上的小优化

上面的sum(x)＝ segma(a[i]) + segma(delta[i]) * (x + 1) – segma(delta[i] * i) 可以化简为：sum(x)＝ segma(a[i] – delta[i] * i) + segma(delta[i]) * (x + 1) 这样的话，我们就可以不用开a这个数组，只需要两个树状数组c1、c2就可以了。。定义c1表示delta[i]，c2表示a[i] – delta[i] * i 更新的话，由于delta[a] += d, delta[b + 1] -= d，所以c2[a] -= d * a，c2[b + 1] += d * (b + 1)，c1[a]和之前的操作一样，c1[a] += d, c1[b + 1] -= d 还是poj 3468，修改后的AC代码为：

Enemy Soilders ★☆☆☆☆ 树状数组基础

Stars ★☆☆ ☆☆ 降维

Tunnel Warfare ★★☆☆☆ 二分模型

Apple Tree ★★☆ ☆☆

Mobile phones ★★☆☆☆ 二维PUIQ

Minimum Inversion Number ★★☆ ☆☆ 树状数组求逆序数

Ultra-QuickSort ★★☆☆☆ 求逆序数，经典树状数组

Cows ★★☆ ☆☆ 区间问题转化成逆序求解

MooFest ★★☆ ☆☆ 转化成求和

Ping pong ★★☆ ☆☆

Conturbatio ★★☆ ☆☆ 其实并不需要树状数组，直接静态求和就行O(1)

Cube ★★☆ ☆☆ 三维树状数组

Japan ★★★☆☆ 逆序模型，交叉统计问题

★★★

Magic Ball Game ★★★☆☆ 树上的统计

Super Mario ★★★☆☆ 降维思想

Median Filter ★★★☆☆ 模糊算法

Disharmony Trees ★★★ ☆☆ 统计问题

Find the non sub ★★★☆☆ 动态规划+树状数组

Traversal ★★★☆☆ 动态规划+树状数组

KiKi's K-Number ★★★☆☆ 二分模型/K大数

Matrix ★★★ ☆☆ 二维IUPQ

Sum the K-th's ★★★☆☆ K大数 / 二分模型

Kiki & Little Kiki 1 ★★★☆☆ 二分模型

The k-th Largest Group ★★★☆☆ 树状数组 + 并查集

Inversion ★★★★☆ 逆序数

Harmony Forever ★★★★☆ 二分模型

另一篇关于树状数组的讲解

作者：Hawstein
出处： http://hawstein.com/posts/binary-indexed-trees.html
声明：本文采用以下协议进行授权：自由转载-非商用-非衍生-保持署名|Creative Commons BY-NC-ND 3.0 ，转载请注明作者及出处。

前言

本文翻译自TopCoder上的一篇文章： Binary Indexed Trees ，并非严格逐字逐句翻译，其中加入了自己的一些理解。水平有限，还望指摘。

简介

我们常常需要某种特定的数据结构来使我们的算法更快，于是乎这篇文章诞生了。在这篇文章中，我们将讨论一种有用的数据结构：数状数组(Binary Indexed Trees)。按 Peter M. Fenwich (链接是他的论文，TopCoder上的链接已坏)的说法，这种结构最早是用于数据压缩的。现在它常常被用于存储频率及操作累积频率表。

定义问题如下：我们有n个盒子，可能的操作为：

往第i个盒子增加石子(对应下文的update函数)
计算第k个盒子到第l个盒子的石子数量(包含第k个和第l个)

原始的解决方案中(即用普通的数组进行存储，box[i]存储第i个盒子装的石子数)，操作1和操作2的时间复杂度分别是O(1)和O(n)。假如我们进行m次操作，最坏情况下，即全为第2种操作，时间复杂度为O(n*m)。使用某些数据结构(如 RMQ) ，最坏情况下的时间复杂度仅为O(m log n)，比使用普通数组为快许多。另一种方法是使用数状数组，它在最坏情况下的时间复杂度也为O(m log n)，但比起RMQ，它更容易编程实现，并且所需内存空间更少。

符号含义

BIT: 树状数组
MaxVal: 具有非0频率值的数组最大索引，其实就是问题规模或数组大小n
f[i]: 索引为i的频率值，即原始数组中第i个值。i=1…MaxVal
c[i]: 索引为i的累积频率值，c[i]=f[1]+f[2]+…+f[i]
tree[i]: 索引为i的BIT值(下文会介绍它的定义)
num^- : 整数num的补，即在num的二进制表示中，0换为1，1换成0。如：num=10101，则 num^- =01010

注意: 一般情况下，我们令f[0]=c[0]=tree[0]=0，所以各数组的索引都从１开始。这样会给编程带来许多方便。

基本思想

每个整数都能表示为一些2的幂次方的和，比如13，其二进制表示为1101，所以它能表示为： 13 = 2^0 + 2^2 + 2^3 .类似的，累积频率可表示为其子集合之和。在本文的例子中，每个子集合包含一些连续的频率值，各子集合间交集为空。比如累积频率c[13]= f[1]+f[2]+…+f[13]，可表示为三个子集合之和(数字3是随便举例的，下面的划分也是随便举例的)，c[13]=s1+s2+s3，其中s1=f[1]+f[2]+…+f[4]，s2=f[5]+f[6]+…+f[12]，s3=f[13]。

idx记为BIT的索引，r记为idx的二进制表示中最右边的1后面0的个数，比如idx=1100(即十进制的12)，那么r=2。tree[idx]记为f数组中，索引从(idx-2^r +1)到idx的所有数的和，包含f[idx-2^r +1]和f[idx]。即： tree[idx]=f[idx-2^r +1]+…+f[idx]，见表1.1和1.2，你就会一目了然。我们也可称idx对索引(idx-2^r +1)到索引idx负责。(We also write that idx is responsible for indexes from (idx-2^r +1)to idx)

假设我们要得到索引为13的累积频率(即c[13])，在二进制表示中，13=1101。因此，我们可以这样计算：c[1101]=tree[1101]+tree[1100]+tree[1000]，后面将详细讲解。

分离出最后的1

注意: 最后的1表示一个整数的二进制表示中，从左向右数最后的那个1。

由于我们经常需要将一个二进制数的最后的1提取出来，因此采用一种高效的方式来做这件事是十分有必要的。令num是我们要操作的整数。在二进制表示中，num可以记为a1b, a代表最后的1前面的二进制数码，由于a1b中的1代表的是从左向右的最后一个1，因此b全为0，当然b也可以不存在。比如说13=1101，这里最后的1右边没有0，所以b不存在。

我们知道，对一个数取负等价于对该数的二进制表示取反加1。所以-num等于(a1b)^- +1= a^- 0b^- +1。由于b全是0，所以b^- 全为1。最后，我们得到：

-num=(a1b)^- +1=a^- 0b^- +1=a^- 0(1…1)+1=a^- 1(0…0)=a^- 1b

现在，我们可以通过与操作(在C++,java中符号为&)将num中最后的1分离出来：

num & -num = a1b & a^- 1b = (0…0)1(0…0)= 2^k (k是0的个数)

读取累积频率

给定索引idx，如果我们想获取累积频率即c[idx]，我们只需初始化sum=0, 然后当idx>0时，重复以下操作：sum加上tree[idx], 然后将idx最后的1去掉。 (C++代码如下)

为什么可以这么做呢？关键是tree数组设计得好。我们知道，tree数组是这么定义的： tree[idx] = f[idx-2^r +1] +…+ f[idx]. 上面的程序sum加上tree[idx]后，去掉idx其二进制表示中的最后的1，假设变为idx1，那么有idx1 = idx-2^r ,　sum接下来加上tree[idx1] = f[idx1-2^r1 +1] +…+ f[idx1] = f[idx1-2^r1 +1] +…+ f[idx-2^r ]，我们可以看到tree[idx1]表达示的最右元素为f[idx-2^r ]，这与tree[idx]表达式的最左元素f[idx-2^r +1]无缝地连接了起来。所以，只需要这样操作下去，即可求得f[1]+…+ f[idx]，即c[idx]的结果。

来看一个具体的例子，当idx=13时，初始sum=0:

tree[1101]=f[13]
tree[1100]=f[9]+...+f[12]
tree[1000]=f[1]+...+f[8]
c[1101]=f[1]+...+f[13]=tree[1101]+tree[1100]+tree[1000]

read函数迭代的次数最多是idx二进制表示中位的个数，其最大值为log(MaxVal)。在本文中MaxVal=16。

时间复杂度：O(log MaxVal)
代码长度：不到10行

改变某个位置的频率并且更新数组

当我们改变f数组中的某个值，比如f[idx]，那么tree数组中哪些元素需要改变呢？在读取累积频率一节，我们每累加一次tree[idx]，就将idx的二进制表示中的最后一个1移除，然后重复该操作。而如果我们改变了f数组，比如f[idx]增加val，我们则需要为当前索引的 tree数组增加val：tree[idx]　+= val。然后idx更新为idx加上其去掉最后的一个1，当idx不大于MaxVal时，不断重复上面的两个操作。详情见以下C++函数：

接下来让我们来看一个例子，当idx=5时：

使用上面的算法或者按照图1.6的箭头所示去操作，我们即可更新BIT。

时间复杂度：O(log MaxVal)
代码长度：不到10行

读取某个位置的实际频率

上面我们已经讨论了如何读取指定索引的累积频率值(即c[idx])，很明显我们无法通过 tree[idx]直接读取某个位置的实际频率f[idx]。有人说，我们另外再开一个数组来存储f数组不就可以了。这样一来，读和存f[idx]都只需要O(1)的时间，而空间复杂度则是O(n)的。不过如果考虑到节约内存空间是更重要的话，我们就不能这么做了。接下来我们将展示在不增加内存空间的情况下，如何读取f[idx]。(事实上，本文所讨论的问题都是基于我们只维护一个tree数组的前提)

事实上，有了前面的讨论，要得到f[idx]是一件非常容易的事： f[idx] = read[idx] - read[idx-1]。即前idx个数的和减去前idx-1个数的和，然后就是f[idx]了。这种方法的时间复杂度是2*O(log n)。下面我们将重新写一个函数，来得到一个稍快一点的版本，但其本质思想其实和read[idx]-read[idx-1]是一样的。

假如我们要求f[12]，很明显它等于c[12]-c[11]。根据上文讨论的规律，有如下的等式: (为了方便理解，数字写成二进制的表示)

c[12]=c[1100]=tree[1100]+tree[1000]
c[11]=c[1011]=tree[1011]+tree[1010]+tree[1000]
f[12]=c[12]-c[11]=tree[1100]-tree[1011]-tree[1010]

从上面3个式子，你发现了什么？没有错，c[12]和c[11]中包含公共部分，而这个公共部分在实际计算中是可以不计算进来的。那么，以上现象是否具有一般规律性呢？或者说，我怎么知道，c[idx]和c[idx-1]的公共部分是什么，我应该各自取它们的哪些tree元素来做差呢？下面将进入一般性的讨论。

让我们来考察相邻的两个索引值idx和idx-1。我们记idx-1的二进制表示为a0b(b全为1)，那么idx即a0b+1=a1b^- .(b^- 全为0)。使用上文中读取累积频率的算法(即read函数) 来计算c[idx]，当sum加上tree[idx]后(sum初始为0)，idx减去最后的1得a0b^- , 我们将它记为z。

用同样的方法去计算c[idx-1]，因为idx-1的二进制表示是a0b(b全为1)，那么经过一定数量的循环后，其值一定会变为a0b^- ,(不断减去最后的1)，而这个值正是上面标记的z。那么，到这里已经很明显了，z往后的tree值是c[idx]和c[idx-1]都共有的，相减只是将它们相互抵消，所以没有必要往下再计算了。

也就是说，c[idx]-c[idx-1]等价于取出tree[idx]，然后当idx-1不等于z时，不断地减去其对应的tree值，然后更新这个索引(减去最后的1)。当其等于z时停止循环(从上面的分析可知，经过一定的循环后，其值必然会等于z)。下面是C++函数：

下面我们来看看根据这个算法，f[12]是怎么计算出来的：

首先，计算z值：z = 12 - (12 & -12) = 8，sum = tree[12] = 11(见表1.1)

对比该算法及调用两次read函数的方法，当idx为奇数时，该算法的时间复杂度仅为O(1)，迭代次数为0。而对于几乎所有的偶数idx，其时间复杂度为c*O(log idx)，其中c严格小于1。而read(idx)-read(idx-1)的时间复杂度为c1*O(log idx)，其中c1总是大于1.

时间复杂度：c*O(log MaxVal),c严格小于1
代码长度：不到15行

缩放整个数状数组

有时候我们需要缩放整个f数组，然后更新tree数组。利用上面讨论的结论，我们可以轻松地达到这个目的。比如，我们要将f[idx]变为f[idx]/c，我们只需要调用上面的update 函数，然后把除以c转变为加上-(c-1)*readSingle(idx)/c即可。这个很容易理解， f[idx]-(c-1)*f[idx]/c = f[idx]/c。用一个for循环即可将所有的tree元素更新。代码如下：

上面的方法似乎有点绕，其实，我们有更快的方法。除法是线性操作，而tree数组中的元素又是f数组元素的线性组合。因此，如果我们用一个因子去缩放f数组，我们就可以用该因子去直接缩放tree数组，而不必像上面程序那样麻烦。上面程序的时间复杂度为 O(MaxVal*log MaxVal)，而下面的程序只需要O(MaxVal)的时间：

时间复杂度：O(MaxVal)
代码长度：几行

返回指定累积频率的索引

问题可描述为：给你一个累积频率值cumFre，如果存在c[idx]=cumFre，则返回idx；否则返回-1。该问题最朴素及最简单的解决方法是求出依次求出c[1]到c[MaxVal]，然后与给出的cumFre对比，如果存在c[idx]=cumFre，则返回idx;否则返回-1。如果f数组中存在负数，那么该方法就是唯一的解决方案。但如果f数组是非负的，那么c数组一定是非降的。即如果i>=j，则c[i]>=c[j]。这种情况下，利用二分查找的思想，我们可以写出时间复杂度为O(log n)的算法。我们从MaxVal的最高位开始(比如本文中 MaxVal是16,所以tIdx从二进制表示10000即16开始)，比较cumFre和tree[tIdx] 的值，根据其比较结果，决定在大的一半区间还是在小的一半区间继续进行查找。 C++函数如下：(如果c数组中存在多个cumFre，find函数返回任意其中一个，findG返回最大的idx值)

来看一个例子，当要查找的累积频率是21时，下面的过程将展示算法是如何进行的： (这里我就不翻译了，偷个懒)

时间复杂度：O(log MaxVal)
代码长度：不到20行

2D BIT(Binary Indexed Trees)

BIT可被扩展到多维的情况。假设在一个布满点的平面上(坐标是非负的)。你有以下三种查询：

将点(x, y)置1
将点(x, y)置0
计算左下角为(0, 0)右上角为(x, y)的矩形内有多少个点(即有多少个1)

如果m是查询次数，max_x和max_y分别是最大的x坐标和最大的y坐标，那么解决该问题的时间复杂度为O(m*log(max_x)*log(max_y))。在这个例子中，tree是个二维数组。对于tree[x][y]，当固定x坐标时，更新y坐标的过程与一维情况相同。如果我们想在点(a, b)处置1/0，我们可以调用函数update(a,b,1)/update(a,b,-1)，其中update函数如下：

其中updatey函数与update函数是相似的：

以上两个函数可以整合成一个函数：

其它函数的修改也非常相似，这里就不一一写出来了。此外，BIT也可被扩展到n维的情况。

问题样例

SRM 310-FloatingMedian
问题2:

描述：

n张卡片摆成一排，分别为第1张到第n张，开始时它们都是下面朝下的。你有两种操作：
1. T(i,j):将第i张到第j张卡片进行翻转，包含i和j这两张。(正面变反面，反面变正面)
2. Q(i):如果第i张卡片正面朝下，返回0；否则返回1.
解决方案：

操作1和操作2都有O(log n)的解决方案。设数组f初始全为0，当做一次T(i, j)操作后，将f[i]加1，f[j+1]减1.这样一来，当我们做一次Q(i)时，只需要求f数组的前i项和c[i] ，然后对2取模即可。结合图2.0，当我们做完一次T(i, j)后，f[i]=1，f[j+1]=-1。这样一来，当k<i时，c[k]%2=0，表明正面朝下；当i<=k<=j时，c[k]%2=1，表明正面朝上(因为这区间的卡片都被翻转了！)；当k>j时，c[k]%2=0，表示卡片正面朝下。 Q(i)返回的正是我们要的判断。

注意：这里我们使用BIT结构，所以只维护了一个tree数组，并没有维护f数组。所以，虽然做一次T(i, j)只需要使f[i]加1，f[j+1]减1，但更新tree数组还是需要 O(log n)的时间；而读取c[k]的时间复杂度也是O(log n)。这里其实只用到了一维BIT 的update函数和read函数。