在RMQ问题(区间最值问题)中,著名的ST算法就是倍增的产物。给定一个长度为N的数列A,ST算法能在时间的预处理后,以的时间复杂度在线回答“数列A中下标在 l~r之间的数的最大值是多少”这样的区间最值问题。
一个序列的子区间个数显然有个,根据倍增思想,我们首先在这个规模为的状态空间里选择一些2的整数次幂的位置作为代表值。
设表示数列A中下标在子区间里的数的最大值,也就是从开始的个数的最大值。递推边界显然是,即数列A在子区间里的最大值。
在递推时,我们把子区间的长度成倍增长,有公式,即长度为的子区间的最大值是左右两半长度为的子区间的最大值中较大的一个。
void ST_perwork(int n){
for(int i=1;i<=n;i++) f[i][0]=A[i];
int t=log(n)/log(2);
for(int j=1;j<=t;j++){
for(int i=1;i<=n-(1<<j)+1;i++){
f[i][j]=max(f[i][j-1],f[i+(1<<(j-1))][j-1]);
}
}
}
当询问任意区间的最值时,我们先计算出一个,满足,也就是使2的次幂小于区间长度的前提下最大的。那么“从开始的个数”和“以结尾的个数”这两段一定覆盖了整个区间,这两段的最大值分别是和,二者中较大的那个就是整个区间的最值。因为求的是最大值,所以这两段只要覆盖区间即可,即使有重叠也没关系。
int ST_query(int l,int r){
int k=log(r-l+1)/log(2);
return max(f[l][k],f[r-(1<<k)+1][k]);
}
简便起见,我们再代码中使用了cmath库的log函数。该函数效率较高,一般来说对程序的性能影响不大。更严格的讲,为了保证复杂度为,应该预处理1~N这N种区间长度各自对应的k值,在询问时直接使用。