RMQ ( Range Maximum/Minimum Query ) 即区间最值问题
先给一个裸的题面:
一个数列中n个数,给出m个询问,询问从[l,r]区间内的最值。(PS:够裸吧!)
对于30%的数据,有n≤1000,m≤1000
对于60%的数据,有n≤100000,m≤10000
对于100%的数据,有n≤1000000,m≤10000
显然朴素的 O(nm) 程序在规定时限内跑不出解的,
而解区间最值问题有基于倍增思想的ST(Sparse Table)算法,
复杂度为 O(nlogn+m) 预处理+查询;
当然也还有线段树的做法,
复杂度为 O(n+mlogn) 建树+查询。
//约定
用数组a表示整个序列
用f[i][j]表示从序列第i个数字开始,连续2^j个数的最值
//预处理 O(nlogn)
这是ST算法中的关键
运用的是DP的思想
转移(递推)方程为 f[i][j]=Max(f[i][j-1],f[i+2^(j-1)][j-1]);
比如说 f[1][1]表示[1,2]间的最值
f[2][3]表示[2,9]间的最值
//为什么表示[1,2]([2,9])的最值而不是[1,3]([2,10])间的?如不理解可回头斟酌下约定中f[i][j]的概念
注意应该用自底向上地递推出f[i][j]的值
//查询 O(m)
ST算法中旨在求出一个最大的k满足k<=log2(j-i+1)
将求f[i][j]转换为求两个可能重合的区间
即求Max(f[i][k],f[j-(2^k)+1][k]),O(1)输出即可
我自己的ST算法代码 (预计得分 70)
#include <cmath>
#include <cstdio>
#include <climits>
#include <cstdlib>
#include <iostream>
#include <algorithm>
using namespace std;
#define maxn 100005
#define Max(Value1,Value2) ((Value1>Value2)?Value1:Value2)
#define Min(Value1,Value2) ((Value1<Value2)?Value1:Value2)
#define Memset(Array,Value) memset(Array,Value,sizeof(Array))
#define Log(Value,base) (int)((log((double)Value))/(log((double)base)))
#define Pow(Value,base) (int)(pow((double)Value,(double)base))
int n,m;
int a[maxn];
int f[maxn][35];
void Prepare()
{
for (int i=1;i<=n;i++) f[i][0]=a[i];
for (int j=1;(1<<j)<=n;j++)
for (int i=1;(i+(1<<j)-1)<=n;i++)
f[i][j]=Max(f[i][j-1],f[i+(1<<(j-1))][j-1]);
}
void RMQ(int i,int j)
{
int k,lk;
for (k=1;(1<<k)<=j-i+1;k++) lk++;
printf("%d\n",Max(f[i][lk],f[j-(1<<lk)+1][lk]));
}
int main()
{
int x,y;
freopen("rmq.in","r",stdin);
freopen("rmq.out","w",stdout);
scanf("%d%d",&n,&m);
for (int i=1;i<=n;i++) scanf("%d",&a[i]);
Prepare();
for (int i=1;i<=m;i++) { scanf("%d%d",&x,&y);RMQ(x,y); }
return 0;
}
值得注意的是,我在代码中已经define了算log与幂但没有使用。
是因为在多组大的随机测试数据证明,这些cmath库函数效率远远不如暴力for出log值与位运算求2^n.
至于线段树的做法,先推荐HH大牛的博客。
具体流程不加赘述。
然后是代码 (预计得分 100)
#include <cstdio>
#include <climits>
#include <cstdlib>
#include <iostream>
#include <algorithm>
#define Memset(Array,Value) memset(Array,Value,sizeof(Array))
#define Max(Value1,Value2) ((Value1>Value2)?(Value1):(Value2))
#define Min(Value1,Value2) ((Value1<Value2)?(Value1):(Value2))
using namespace std;
#define maxn 100000
int n,m,tot;
int a[maxn<<2];
void Pushup(int rt)
{
a[rt]=Max(a[rt<<1],a[rt<<1|1]);
}
void BuildTree(int l,int r,int rt)
{
if (l==r) { scanf("%d",&a[rt]);return; }
int mid=(l+r)>>1;
if (l<=mid) BuildTree(l,mid,rt<<1);
if (r >mid) BuildTree(mid+1,r,rt<<1|1);
Pushup(rt);
}
void Query(int x,int y,int l,int r,int rt)
{
if ((x<=l)&&(y>=r)) { tot=Max(a[rt],tot);return; }
int mid=(l+r)>>1;
if (x<=mid) Query(x,y,l,mid,rt<<1);
if (y >mid) Query(x,y,mid+1,r,rt<<1|1);
}
int main()
{
int x,y;
freopen("rmq.in","r",stdin);
freopen("rmq.out","w",stdout);
scanf("%d%d",&n,&m);
BuildTree(1,n,1);
for (int i=1;i<=m;i++)
{
scanf("%d%d",&x,&y);tot=-INT_MAX;
Query(x,y,1,n,1);
printf("%d\n",tot);
}
return 0;
}
尽管理论上线段树要慢,但实际上线段树效率和ST算法效率差不多。
因为在处理log时无论如何都浪费了常数时间,至于n,m在哪种范围内会有何种不同的效率,
我就没有做数据去测了,不过对于我来说,线段树的编程复杂度与思想复杂度都是远远低于ST算法的。
而ST算法的可取之处,主要在倍增算法的应用吧。
当然,针对RMQ问题还有其他解法:
1.RMQ-CT-Tarjan
时间复杂度O((n+m)a(n))
预计得分 100
2.RMQ-CT-( + )1RMQ
时间复杂度O(n+m)
预计得分 100
再给一道思考题
一个数列中n个数,给出m个询问,询问从[l,r]区间内的最值。(且每次给的[l,r]互不包含)
解题方法有
1.堆
时间复杂度O(nlogn)
预计得分 70
//为什么可以用堆?
2.队列
时间复杂度O(n+m)
预计得分 100
//为什么可以用队列?
其实两种方法都基于这样一个条件-->区间互不包含。(好吧这是废话)
具体留给读者思考。(可耻吧!)