是个啥
ST表(Sparse Table,稀疏表)是一种简单的数据结构,主要用来解决RMQ(Range Maximum/Minimum Query,区间最大/最小值查询)问题。
可以O(n * log2(n))预处理,和O(1)查询。
为个啥
RMQ问题可以通过简单的预处理得到所有区间的答案。
O(n^2)的方法是枚举长度和左端点,做一个简单的dp转移。
状态表示成: dp[左端点][区间长度] = 区间最值
初始化: dp[i][1] = a[i]
转移方程: dp[i][j] = max(dp[i][j-1], dp[i + j - 1][1])
ST表更进一步,利用了倍增的思想,把预处理的复杂度降到了O(n * log2(n))
可以看到朴素的转移方程每一次只把长度扩展了一位,而RMQ的问题只需要找到一个最值,不妨把区间的长度每次增长一倍,那么区间的长度只会是2的n次方。
所以改进后:
状态 : dp[左端点][区间长度(2的 j 次方)] = 区间最值
初始化: dp[i][0] = a[i] // (2^0 == 1)
转移方程: dp[i][j] = max(dp[i][j - 1], dp[i + 1 << (j - 1)][j - 1])
需要注意的是转移方程的外循环是长度,内循环是左端点。
咋用
预处理
void init(){
for(int i = 1 ; i <= n ; i++)dp[i][0] = a[i];
for(int j = 1 ; (1 << j) <= n ; j++){
for(int i = 1 ; i + (1 << j) - 1 <= n ; i++){
dp[i][j] = max(dp[i][j - 1], dp[i + (1 << (j - 1))][j - 1]);
}
}
}
这时候长得比较帅的读者就要问了,那我查询的区间不是2的n次方,你这查询不就得写成线段树一样是O(nlog2(n))了吗?
因为他是RMQ,只要是在询问的范围内,不需要担心查询重复的区间。
假设查询的区间是[l, r]
int solve(int l,int r){
int len = log2(r - l + 1);
return max(dp[l][len], dp[r - (1 << len) + 1][len]);
}
小技巧
题意
给一串数字,问是否是若干n的排列组合而成的数组的某一区间
时间复杂度要求在O(n * log2(n))
例如: 3 1 2 3 1 可以看成是 2 [3 1 2 3 1],所以回答yes
3 3 1 2 3 则无法拆分成若干个3的排列,所以回答no
操作一下
开个数组b[i]记录下一个a[i]出现的下标
a[i] : 3 1 2 3 1
b[i] : 4 5 inf inf inf
想要知道a数组中[l ,r]是否是可以看作是一个排列只需要让b[l]~b[r]的值都大于r即可
所以问题转化为了RMQ
如果a[i]最大值是mx,则区间长度为mx,共有n / mx 个区间。
又因为第一个区间的起点不确定有mx种可能,所有复杂度O(n * mx / mx) = O(n)
处理ST表的复杂度O(n * log2(n))
搞定。