蒟蒻再一次被虐傻了。。。。。
原先yy了一个dp方案:考虑上半段(一个正立的三角),f[i][j]表示从从小往大放,现在的底为i,高为j的方案数。
再从搞一个下半段的计数h[i][j],表示目前高为j,接下来放的底大小为i(当前的严格小于i)的方案数。
可以发现,f[i][j]的计算很容易用O(n^3)内的时间内得到,h也很容易由f算得。(利用前缀和很容易把f的计算优化到O(n^2))
只要利用乘法原理吧两个数组合成g[i][j],表示此图形最宽处为i,高位j的方案数。ans=sigma( g[i][j]*(m-i+1)*(n-j+1) )
交了发代码,不负众望的T了,罪魁祸首就是下面的代码:
for (i=2;i<=m;i++){
for (j=1;j<=n;j++)
for (k=0;k<=j;k++)
g[i][j]=(g[i][j]+(LL)f[i][k]*h[i][j-k]%Mod)%Mod;
}
很容易发现每一个循环i下面的计算其实是个卷积——FFT!
结果。。。。
double暴精度了T_T。。。。。
看来这方法行不通了!
我们得另辟蹊径
利用h计算的方法似乎无法优化了,那么我们就把它丢了
没了h我们怎么计算呢?不妨把f数组继续向下推导!但是这样是不是我们需要再多以为状态记录最宽处宽度才行呢?
其实没有必要!
我们可以看到每次f数组自身内的转移时加减法,而最后计算答案是才用到乘法,这样乘法分配率可以把这些东西结合起来,也就说计算完f之后把f[i][j]*=(m-i+1)在转移即可。
写出方程后不拿发现这样的方程仍然是很容易用前缀和优化的
复杂度O(n^2)
#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
typedef long long LL;
const int Mod=(1e9)+7;
int n,m,ans,i,j,k,tmp,f[2005][2005];
int sum[2005][2005],h[2005][2005];
int main(){
//freopen("295D.in","r",stdin);
//freopen("295D.out","w",stdout);
scanf("%d%d",&n,&m);
for (i=2;i<=m;i++){
f[i][1]=1;
sum[i][1]=i-1;
}
for (i=2;i<=n;i++)
for (j=2;j<=m;j++){
f[j][i]=(f[j-1][i]+sum[j][i-1])%Mod;
sum[j][i]=(f[j][i]+sum[j-1][i])%Mod;
}
memset(sum,0,sizeof(sum));
for (i=1;i<=n;i++)
for (j=m;j>0;j--){
f[j][i]=(LL)f[j][i]*(m-j+1)%Mod;
sum[j][i]=(sum[j+1][i]+f[j][i])%Mod;
}
for (i=2;i<=n;i++){
for (j=m;j>1;j--)
h[j][i]=(h[j+1][i]+sum[j][i-1])%Mod;
for (j=m;j>1;j--)
h[j][i]=(h[j][i]-f[j][i-1]+Mod)%Mod;
}
memset(sum,0,sizeof(sum));
for (i=2;i<=n;i++)
for (j=m,tmp=0;j>1;j--){
tmp=(tmp+sum[j][i-1])%Mod;
h[j][i] = ( h[j][i]+tmp )%Mod;
sum[j][i] = ( sum[j+1][i]+h[j][i] )%Mod;
}
for (i=1;i<=m;i++)
for (j=1;j<=n;j++){
ans=(ans+(LL)f[i][j]*(n-j+1)%Mod)%Mod;
ans=(ans+(LL)h[i][j]*(n-j+1)%Mod)%Mod;
}
printf("%d\n",ans);
return 0;
}