给一个数组 ,其中有 N 个数字,现在有 n 次询问,给你区间 [l ,r],问你在这个区间内的最大或最小值为多少?
看到这种问题,我们首先想到的是用 for 循环遍历得出最大最小值,可是,在数字非常大的情况下,这种方法还能行得通吗?比如,N=50000,有不大于 200,000 次询问,很明显会超时,那我们应该怎样去处理这类问题呢?此时,就需要用RMQ来解决此类问题。
👇
RMQ (Range Minimum/Maximum Query),即区间最值查询,此类问题是指:对于长度为 n 的数列 A,回答若干询问 RMQ( A, i, j) (i,j<=n),返回数列 A 中下标在 i, j 里的最小(大)值,也就是说,RMQ问题是指求区间最值的问题。
时间复杂度:O(N)~O(logN)
【思想】
假设数组 arr = [ 3, 2, 4, 5, 6, 8, 1, 2, 9, 7]
下标 i 1 2 3 4 5 6 7 8 9 10 arr[ i ] 3 2 4 5 6 8 1 2 9 7 设一个二维数组 dp[ i ][ j ] 表示从第 i 位开始连续 2^j 个数中的最小值。例如 dp[2][1] 就表示从第二位数开始连续两个数的最小值(也就是从第二位数到第三位数的最小值),即2,4中的最小值,所以 dp[2][1] = 2;
其实我们求 dp[ i ][ j ] 的时候可以把它分成两部分,第一部分是从 i 到 i+2^(j-1)-1,第二部分从 i+2^(j-1) 到 i+2^j-1 (i+2^(j-1)+2^(j-1)-1),为什么可以这么分呢?其实我们都知道二进制数前一个数是后一个的两倍,那么可以把 i 到 这个区间通过 分成相等的两部分, 那么转移方程很容易就写出来了。(dp[i][0]就表示第i个数字本身)
dp[ i ][ j ] = min( dp [ i ][ j-1 ], dp [ i + (1 << (j - 1)) ][ j - 1 ] )
void rmq_init(){
for(int i = 1; i <= n; i++)
dp[i][0] = a[i];
for(int j = 1; (1<<j) <= n; j++){
for(int i = 1; i+(1<<j)-1 <= n; i++){
dp[i][j] = max(dp[i][j-1], dp[i+(1<<(j-1))][j-1]);
}
}
}
这里需要注意一个循环变量的顺序,我们看到外层循环变量为 j,内层循环变量为 i,这是为什么呢?可以互换一下位置吗?
答案当然是不可以,我们要理解这个状态转移方程的意义,这个状态方程的含义是:先更新每两个元素中的最小值,然后通过每两个元素的最小值获得每4个元素中的最小值,依次类推更新所有长度的最小值。
而如果是 i 在外,j 在内的话,我们更新的顺序就变成了从1 开始的前1个元素,前2个元素,前4个元素,前8个元素。。。
RMQ的查询部分
假设我们需要查询区间 [ l, r ] 中的最小值,则区间 [ l, r ] 的最小值 RMQ[ l, r ] = min(dp[ l ][ k ], dp[ r - (1 << k) +1 ][ k ]);
但是为什么这样就可以保证是区间最小值了呢?
dp[ l ][ k ] 维护的是区间 [ l, l + 2^k - 1] , dp[r - (1 << k) + 1][ k ] 维护的是区间 [r - 2^k + 1, (r-2^k+1)+2^k-1] ,即 [ r-2^k+1, r ]。
那么只要我们保证 < 就能保证 RMQ[ l, r ] = min(dp[ l ][ k ], dp[ r - (1 << k) + 1 ][ k ]),即 r-l+2 < 2^(k+1);
不能等于,相等的那个点可能正好是最大最小值
int rmq(int l, int r){
int k=0;
while(1<<(k+1) < r-l+2)
k++;
return max(dp[l][k],dp[r-(1<<k)+1][k]);
}