传送门:http://acm.hdu.edu.cn/showproblem.php?pid=2604
今天学习了一发矩阵快速幂,暂时将这个算法的作用理解为用来加速递推。
这题就是一个递推,但是因为模数不一样,所以每次都要重新计算一下递推的答案,那么直接for一遍会超时,但是用矩阵快速幂来递推就跑的飞快啦!
思路:在每个合法队列后面加一个’m’是合法的,所以f(n-1)是一部分。如果要在合法队列最后加上’f’的话,就要考虑两种情况,一种是mmf,一种是mmff,这两种就是f(n-3)+f(n-4)。递推式就是f(n)=f(n-1)+f(n-3)+f(n-4)。矩阵快速幂其实就是快速幂,只是把数字相乘改为了矩阵相乘,那么构造一个4*4的矩阵,用这个矩阵来递推,就可以模拟递推的过程啦!
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<cstdlib>
#include<cctype>
#include<string>
#include<iostream>
#include<vector>
#include<map>
#include<queue>
using namespace std;
#define PB push_back
typedef long long ll;
typedef pair<int,int> pii;
const int INF=1e9+7;
#define lson l,m,rt<<1
#define rson m+1,r,rt<<1|1
#define calm (l+r)>>1
int n,m;
struct node{
int a[4][4];
friend node operator * (node a,node b){
node c;
for(int i=0;i<4;i++){
for(int j=0;j<4;j++){
c.a[i][j]=0;
for(int k=0;k<4;k++){
c.a[i][j]=(c.a[i][j]+a.a[i][k]*b.a[k][j])%m;
}
}
}
return c;
}
friend node operator ^ (node a,int b){
node r;
memset(r.a,0,sizeof r.a);
for(int i=0;i<4;i++){r.a[i][i]=1;}
while(b){
if(b&1)r=r*a;
a=a*a;
b>>=1;
}
return r;
}
};
int main(){
//freopen("input.txt","r",stdin);
int s[4]={9,6,4,2};
int temp[4][4]={
{1,0,1,1},//i-1 i
{1,0,0,0},//i-2 i-1
{0,1,0,0},//i-3 i-2
{0,0,1,0} //i-4 i-3
};
node base;
for(int i=0;i<4;i++){
for(int j=0;j<4;j++){
base.a[i][j]=temp[i][j];
}
}
while(scanf("%d%d",&n,&m)!=EOF){
if(n==0||m==1){
printf("0\n");continue;
}
if(n<=4){
printf("%d\n",s[4-n]%m);continue;
}
node mat=base^(n-4);
int ans=0;
for(int i=0;i<4;i++){
ans=(ans+mat.a[0][i]*s[i])%m;
}
printf("%d\n",ans);
}
return 0;
}