1.预处理以(i,j)为左上角的子矩阵的代价
2.然后优先队列+暴力修改
#include<iostream>
#include<cmath>
#include<cstdio>
#include<cstring>
#include<queue>
using namespace std;
const int maxn = 1000+10;
int val[maxn][maxn];
int M,N;
typedef __int64 LL;
struct PP{
int x,y;LL w;
PP(int x=-1,int y=-1,LL w=-1):x(x),y(y),w(w){}
bool operator<(const PP & th)const {
if(w==th.w)return x==th.x?y>th.y:x>th.x;
return w>th.w;
}
}pp[maxn*maxn];
int cnt;
LL sum[maxn][maxn];
int vis[maxn][maxn];
LL sta[maxn*maxn*3],top;
int a,b;
void dele(int x,int y){
int l=max(1,y-b+1),r=min(M,y+b-1);
int u=max(1,x-a+1),d=min(N,x+a-1);
for(int i=u;i<=d;i++){
for(int j=l;j<=r;j++)vis[i][j]=1;
}
}
priority_queue<PP> qq;
int mm1[maxn][maxn];
int mm2[maxn][maxn];
int main()
{
#ifdef DouBi
freopen("in.cpp","r",stdin);
#endif // DouBi
while(scanf("%d%d%d%d",&N,&M,&a,&b)!=EOF)
{
for(int i = 1; i <= N; i++)
for(int j = 1; j <= M; j++)
scanf("%d",&val[i][j]);
for(int i=1;i<=N;i++){
int l=0,r=0;
for(int j=M;j>=1;j--){
while(r>l&&sta[l]>j+b-1)l++;
while(r>l&&val[i][sta[r-1]]>=val[i][j])r--;
sta[r++]=j;
mm1[i][j]=val[i][sta[l]];
}
}
for(int j=1;j<=M;j++){
int l=0,r=0;
for(int i=N;i>=1;i--){
while(r>l&&sta[l]>i+a-1)l++;
while(r>l&&mm1[sta[r-1]][j]>=mm1[i][j])r--;
sta[r++]=i;
mm2[i][j]=mm1[sta[l]][j];
}
}
// for(int i=1;i<=N;i++){
// for(int j=1;j<=M;j++)printf("%d ",mm1[i][j]);printf("\n");
// }printf("\n");
// for(int i=1;i<=N;i++){
// for(int j=1;j<=M;j++)printf("%d ",mm2[i][j]);printf("\n");
// }printf("\n");
for(int i=1;i<=N;i++){
for(int j=1;j<=M;j++)sum[i][j]=sum[i][j-1]+val[i][j];
}
for(int i=1;i<=N;i++){
for(int j=1;j<=M;j++){
sum[i][j]=sum[i-1][j]+sum[i][j];
}
}
// for(int i=1;i<=N;i++){
// for(int j=1;j<=M;j++)printf("%I64d ",sum[i][j]);printf("\n");
// }
//printf("%d %I64d\n",mm2[4][8],sum[4][8]);
cnt=0;
memset(vis,0,sizeof(vis));
for(int i=1;i<=N-a+1;i++){
for(int j=1;j<=M-b+1;j++){
LL xx=sum[i+a-1][j+b-1]-sum[i+a-1][j-1]-sum[i-1][j+b-1]+sum[i-1][j-1];
//if(i==4&&j==8)printf("%I64d ",xx);
xx-=(LL)mm2[i][j]*a*b;
//if(i==4&&j==8)printf("%I64d\n",xx);
qq.push(PP(i,j,xx));
}
}
top=0;
while(!qq.empty()){
PP tmp=qq.top();qq.pop();
int x=tmp.x,y=tmp.y;LL w=tmp.w;
if(!vis[x][y]){
sta[top++]=x;sta[top++]=y;sta[top++]=w;
dele(x,y);
}
}
printf("%d\n",top/3);
for(int i=0;i<top;i+=3){
printf("%I64d %I64d %I64d\n",sta[i],sta[i+1],sta[i+2]);
}
}
return 0;
}