树状数组
树状数组(Binary Indexed Tree(BIT), Fenwick Tree)是一个查询和修改复杂度都为log(n)的数据结构。主要用于查询任意两位之间的所有元素之和,但是每次只能修改一个元素的值;经过简单修改可以在log(n)的复杂度下进行范围修改,但是这时只能查询其中一个元素的值。
基本概念:
假设数组a[1..n],那么查询a[1]+...+a[n]的时间是log级别的,而且是一个在线的数据结构,支持随时修改某个元素的值,复杂度也为log级别。
来观察这个图:
树状数组的结构图
令这棵树的结点编号为C1,C2...Cn。令每个结点的值为这棵树的值的总和,那么容易发现:
C1 = A1
C2 = A1 + A2
C3 = A3
C4 = A1 + A2 + A3 + A4
C5 = A5
C6 = A5 + A6
C7 = A7
C8 = A1 + A2 + A3 + A4 + A5 + A6 + A7 + A8
...
C16 = A1 + A2 + A3 + A4 + A5 + A6 + A7 + A8 + A9 + A10 + A11 + A12 + A13 + A14 + A15 + A16
这里有一个有趣的性质:
我们来看一下这个规律,
C1(0001)末尾二进制0的个数是0,并且C1管辖的范围是C1=A1;
C2(0010)末尾二进制0的个数是1,并且C2管辖的范围是C2=A1+A2;
C3(0011)末尾二进制0的个数是0,并且C3管辖的范围是C3=A3;
......
C8(1000)末尾二进制0的个数是3,并且C2管辖的范围是C8=A1+A2+A3+A4+A5+A6+A7+A8;
设节点编号为x,那么这个节点管辖的区间为2^k(其中k为x二进制末尾0的个数)个元素。因为这个区间最后一个元素必然为Ax,
所以很明显:Cn = A(n – 2^k + 1) + ... + An
基本操作:
1,对于C[i]=a[i - 2^k + 1]...a[i]的定义中,比较难以逐磨的k,他的值等于i这个数的二进制表示末尾0的个数. 如4的二进制表示0100,此时k就等于2,而实际上我们还会发现2^k就是前一位的权值,即0100中,2^2=4,刚好 是前一位数1的权值.所以所以2^k可以表示为n&(n^(n-1))或更简单的n&(-n),例如:
为了表示简便,假设现在一个int型为4位,最高位为符号位
int i=3&(-3); 此时i=1,3的二进制为0011,-3的二进制为1101(负数存的是补码)所以0011&1101=1
int j=4&(-4); 此时j=4,理由同上.....
所以计算2^k我们可以用如下代码:
int lowbit(int n)
{
return n&(-n);
}
2,求和操作
在上面的示意图中,若我们需要求sum[1..7]个元素的和,仅需要计算c[7]+c[6]+c[4]的和即可,究竟时间复杂度怎么算呢?一共要进行多少次求和操作呢?
n-=lowbit(n);这一项实际上等价于将当前二进制串中的最后一个1减去,因为数的二进制串中1的个数最多有log(n)个,所以它的时间复杂度为log(n);
求sum[1..k],我们需查找k的二进制表示中1的个数次就能得到最终结果,所以时间复杂度为log(n)。
int GetSum(int n)
{
int sum=0;
while(n>0)
{
sum+=TreeArray[n];
n-=lowbit(n);
}
return sum;
}
以求sum[1..7]为例,二进制为0111,右边第一个1出现在第0位上,也就是说要从a[7]开始向前数1个元素(只有a[7]),即c[7];
然后将这个1舍掉,得到6,二进制表示为0110,右边第一个1出现在第1位上,也就是说要从a[6]开始向前数2个元素(a[6],a[5]),即c[6];
然后舍掉用过的1,得到4,二进制表示为0100,右边第一个1出现在第2位上,也就是说要从a[4]开始向前数4个元素(a[4],a[3],a[2],a[1]),即c[4].
所以s[7]=c[7]+c[6]+c[4];
3,更新操作
在上面的示意图中,假设更改的元素是a[2],那么它影响到得c数组中的元素有c[2],c[4],c[8],我们只需一层一层往上修改就可以了,这个过程的最坏的复杂度也不过O(logN);
void update(int n,int num)
{
while(n<=MAX)
{
TreeArray[n]+=num;
n+=lowbit(n);
}
}
n+=lowbit(n);这一项实际上等价于在二进制串中补0;
以修改a[2]元素为例,需要修改c[2],2的二进制为0010,末尾补0为0100,即c[4]
4的二进制为0100,在末尾补0为1000即c[8]。所以我们需要修改的有c[2],c[4],c[8]