RMQ-CSDN博客

本文链接：https://blog.csdn.net/qq_43333395/article/details/89442824

RMQ

RMQ（Range Minimum/Maximum Query），即区间最值查询，这是一种在线算法，所谓在线算法，是指用户每次输入一个查询，便马上处理一个查询。RMQ算法一般用较长时间做预处理，时间复杂度为O(nlogn)，然后可以在O（1）的时间内处理每次查询。

下面我们从一个实际问题来解释RMQ

我们假设数组arr为：1，3，6，7，4，2，5

我们设二维数组dp[i][j]表示从第i位开始连续2^j个数中的最小值。例如dp[2][1]就表示从第二位数开始连续两个数的最小值（也就是从第二位数到第三位数的最小值），即3，6中的最小值，所以dp[2][1] = 3;

其实我们求 dp[i][j] 的时候可以把它分成两部分，第一部分是从 i 到 i + 2 ^( j-1 ) - 1 ，第二部分从 i + 2 ^( j-1 ) 到i + 2^j -1 ，为什么可以这么分呢？其实我们都知道二进制数前一个数是后一个的两倍，那么可以把 i ~ i + 2^j -1 这个区间通过2^(j-1) 分成相等的两部分，那么转移方程很容易就写出来了。（dp[i][0]就表示第i个数字本身）

dp[i][j] = min(dp [i][j - 1], dp [i + (1 << j - 1)][j - 1])

由此给出下列代码：

void rmq_init()
{
    for(int i=1;i<=N;i++)
        dp[i][0]=arr[i];//初始化
    for(int i=1;(1<<i)<=N;i++)
        for(int j=1;j+(1<<i)-1<=N;j++)
            dp[j][i]=min(dp[j][i-1],dp[j+(1<<i-1)][i-1]);
}

这里需要注意一个循环变量的顺序，我们看到外层循环变量为j，内层循环变量为i，这是为什么呢？可以互换一下位置吗？

答案当然是不可以，我们要理解这个状态转移方程的意义，这个状态方程的含义是：先更新每两个元素中的最小值，然后通过每两个元素的最小值获得每4个元素中的最小值，依次类推更新所有长度的最小值。

而如果是i在外，j在内的话，我们更新的顺序就变成了从1开始的前1个元素，前2个元素，前4个元素，前8个元素。。。

当j等于3的时候dp[1][3]=min(min(ans[0],ans[1],ans[2],ans[3]),min(ans[4],ans[5],ans[6],ans[7])))的值，

但是我们根本没有计算min(ans[0],ans[1],ans[2],ans[3])和min(ans[4],ans[5],ans[6],ans[7])，所以这样的方法肯定是错误的。

为了避免这样的错误，一定要好好理解这个状态转移方程所代表的含义。

加深理解：
例如：

A数列为：3 2 4 5 6 8 1 2 9 7

F[1，0]表示第1个数起，长度为2^0=1的最大值，其实就是3这个数。同理 F[1,1] = max(3,2) = 3, F[1，2]=max(3,2,4,5) = 5，F[1，3] = max(3,2,4,5,6,8,1,2) = 8;

并且我们可以容易的看出F[i,0]就等于A[i]。（DP的初始值）

我们把F[ i，j ]平均分成两段（因为F[ i，j ]一定是偶数个数字），从 i 到i + 2 ^ (j - 1) - 1为一段，i + 2 ^ (j - 1)到i + 2 ^ j - 1为一段(长度都为2 ^ (j - 1))。于是我们得到了状态转移方程F[ i , j ]=max（F[ i，j-1 ], F[ i + 2^(j-1)，j-1 ]）。

接下来我们来讲解RMQ的查询部分，假设我们需要查询区间[l ，r]中的最小值，令k = log2(r - l + 1); 则区间[l, r]的最小值RMQ[l,r] = min(dp[l][k], dp[r - (1 << k) + 1][k]);

但是为什么这样就可以保证是区间最小值了呢？

mn[l][k]维护的是[l, l + 2 ^ k - 1], mn[r - (1 << k) + 1][k]维护的是[r - 2 ^ k + 1, r] 。

那么只要我们保证r - 2 ^ k + 1 <= l + 2 ^ k - 1就能保证RMQ[l,r] = min(dp[l][k], dp[r - (1 << k) + 1][k])；

接下来我们用分析法来证明这个不等式：

我们假设 r - 2^k +1 <= l + 2^k -1 这个等式成立

即有 r - l + 2 <= 2^(k+1) 也就是 r - l + 2 <= 2 * 2^k

又因为 k =log2 (r- l + 1);

那么 r - l + 2 <= 2 * (r - l +1)

则 r - l + 2 <= 2*(r - l) + 2

所以 r - l >= 0 所以假设成立

我们举个栗子 l = 4，r = 6;

我们假设数组arr为：1，3，6，7，4，2，5

此时 k = log2( r - l + 1）= log2（3）=1

则dp[4][6] = min（dp[4][1],dp[5][1]）

dp[4][1] = 4，dp[5][1] = 2，所以dp[4][6] = min(dp[4][1],dp[5][1]) = 2

我们很容易看出来答案是正确的。

由此给出查询部分代码：

int rmq(int l,int r)
{
    int k=log2(r-l+1);
    return min(dp[l][k],dp[r-(1<<k)+1][k]);
}

RMQ算法，是一个快速求区间最值的离线算法，预处理时间复杂度O（n*log(n)），查询O(1)，所以是一个很快速的算法，当然这个问题用线段树同样能够解决。
1、求区间的最大值和最小值！

#include <cstdio>
#include <cstring>
#include <cmath>
#include <iostream>
using namespace std;
const int MAXN = 100117;
int n,query;
int num[MAXN];

int F_Min[MAXN][20],F_Max[MAXN][20];

void Init()
{
   for(int i = 1; i <= n; i++)
   {
       F_Min[i][0] = F_Max[i][0] = num[i];
   }

   for(int i = 1; (1<<i) <= n; i++)  //按区间长度递增顺序递推
   {
       for(int j = 1; j+(1<<i)-1 <= n; j++)  //区间起点
       {
           F_Max[j][i] = max(F_Max[j][i-1],F_Max[j+(1<<(i-1))][i-1]);
           F_Min[j][i] = min(F_Min[j][i-1],F_Min[j+(1<<(i-1))][i-1]);
       }
   }
}

int Query_max(int l,int r)
{
   int k = (int)(log2(double(r-l+1)));
   return max(F_Max[l][k], F_Max[r-(1<<k)+1][k]);
}

int Query_min(int l,int r)
{
   int k = (int)(log2(double(r-l+1)));
   return min(F_Min[l][k], F_Min[r-(1<<k)+1][k]);
}

int main()
{
   int a,b;
   scanf("%d %d",&n,&query);
   for(int i = 1; i <= n; i++)
       scanf("%d",&num[i]);
   Init();
   while(query--)
   {
       scanf("%d %d",&a,&b);
       printf("区间%d到%d的最大值为：%d\n",a,b,Query_max(a,b));
       printf("区间%d到%d的最小值为：%d\n",a,b,Query_min(a,b));
       printf("区间%d到%d的最大值和最小值只差为：%d\n",a,b,Query_max(a,b)-Query_min(a,b));
   }
   return 0;
}

2、求区间内出现次数最多的数字出现的次数！
对上升序列如：1 1 2 2 2 3 3 4 5 5 … 统计区间出现次数最多数个数。

我们可以构造一个b[]数组，

if（a[i]==a[i-1]）b[i]=b[i-1]+1;

else b[i]=1;

这样对上述例子，b[]数组有1 2 1 2 3 1 2 1 1 2

那么对询问区间[l,r]，如果l在数与数交界处，那么直接查询l,r区间最大值。

否则要知道与a[l]相同延伸到end，那么这个区间大小end-l+1，与rmq(end+1，r)取最大值就是答案。

#include <cstdio>
#include <cmath>
#include <algorithm>
using namespace std;
 
const int maxn = 100017;
int num[maxn], f[maxn], MAX[maxn][20];
int n;
int max(int a,int b)
{
    return a>b ? a:b;
}
int rmq_max(int l,int r)
{
    if(l > r)
        return 0;
    int k = log2((double)(r-l+1));
    return max(MAX[l][k],MAX[r-(1<<k)+1][k]);
}
void init()
{
    for(int i = 1; i <= n; i++)
    {
        MAX[i][0] = f[i];
    }
    int k = log2((double)(n+1));
    for(int i = 1; i <= k; i++)
    {
        for(int j = 1; j+(1<<i)-1 <= n; j++)
        {
            MAX[j][i] = max(MAX[j][i-1],MAX[j+(1<<(i-1))][i-1]);
        }
    }
}
int main()
{
    int a, b, q;
    while(scanf("%d",&n) && n)
    {
        scanf("%d",&q);
        for(int i = 1; i <= n; i++)
        {
            scanf("%d",&num[i]);
        }
        sort(num+1,num+n+1);
        for(int i = 1; i <= n; i++)
        {
            if(i == 1)
            {
                f[i] = 1;
                continue;
            }
            if(num[i] == num[i-1])
            {
                f[i] = f[i-1]+1;
            }
            else
            {
                f[i] = 1;
            }
 
        }
 
        init();
 
        for(int i = 1; i <= q; i++)
        {
            scanf("%d%d",&a,&b);
            int t = a;
            while(t<=b && num[t]==num[t-1])
            {
                t++;
            }
            int cnt = rmq_max(t,b);
            int ans = max(t-a,cnt);
            printf("%d\n",ans);
        }
    }
    return 0;
}
/*
10 3
-1 -1 1 2 1 1 1 10 10 10
2 3
1 10
5 10
*/