链接
题解
更新整个矩阵是 O ( n k ) O(nk) O(nk)的,但是可以一次处理某个时刻所有修改对所有查询的贡献
计算某次修改对某次查询的贡献是 O ( 1 ) O(1) O(1)的,但是只能处理一个修改对一个查询的贡献,要想处理所有修改对当前查询的贡献,需要 O ( m ) O(m) O(m)的时间
有一种巧妙的分块,可以结合二者的优点
搞一个 v e c t o r vector vector存储修改操作,规定其大小存在一个上限 S S S,当 v e c t o r vector vector中的修改操作个数超过 S S S时,就进行暴力 O ( n k ) O(nk) O(nk)的计算
每次查询的时候,答案就是 v e c t o r vector vector中的贡献加上已处理过的贡献
这样的复杂度如何?
假设查询和修改的数量级相近,那么时间复杂度就是 O ( n k m S + m s ) O(nk\frac{m}{S}+ms) O(nkSm+ms),用均值不等式得到 S = n k S=\sqrt{nk} S=nk时式子取到最小值,时间复杂度为 O ( m n k ) O(m \sqrt {nk}) O(mnk)
代码
#include <bits/stdc++.h>
#include <ext/pb_ds/assoc_container.hpp>
#include <ext/pb_ds/tree_policy.hpp>
#define iinf 0x3f3f3f3f
#define linf (1ll<<60)
#define eps 1e-8
#define maxn 100010
#define maxk 42
#define cl(x) memset(x,0,sizeof(x))
#define rep(i,a,b) for(i=a;i<=b;i++)
#define em(x) emplace(x)
#define emb(x) emplace_back(x)
#define emf(x) emplace_front(x)
#define fi first
#define se second
#define de(x) cerr<<#x<<" = "<<x<<endl
using namespace std;
using namespace __gnu_pbds;
typedef long long ll;
typedef pair<int,int> pii;
typedef pair<ll,ll> pll;
ll read(ll x=0)
{
ll c, f(1);
for(c=getchar();!isdigit(c);c=getchar())if(c=='-')f=-f;
for(;isdigit(c);c=getchar())x=x*10+c-0x30;
return f*x;
}
#define mod 1000000007ll
ll n, m, k, a[maxk][maxn], S, type, f[maxk][maxn], tot;
pll v[maxn];
int main()
{
ll i, j, x, y;
n=read(), m=read(), k=read();
rep(i,0,k)f[i][0]=1;
rep(i,1,k)rep(j,1,n)f[i][j]=(f[i][j-1]+f[i-1][j])%mod;
S=sqrt(k*n);
while(m--)
{
type=read(), x=read();
if(type==0)y=read();
if(type==0)v[++tot]=pll(x,y);
else
{
ll ans=a[k][x];
rep(i,1,tot)if(v[i].first<=x)ans+=v[i].second*f[k][x-v[i].first];
ans%=mod;
printf("%lld\n",ans);
}
if(tot>S)
{
rep(i,1,tot)(a[0][v[i].first]+=v[i].second)%=mod;
tot=0;
rep(i,1,k)rep(j,1,n)a[i][j]=(a[i][j-1]+a[i-1][j])%mod;
}
}
return 0;
}