P4503 [CTSC2014]企鹅QQ
题目背景
PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
题目描述
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的n 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的N 个字符串长度均等于L ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。
输入输出格式
输入格式:
第一行包含三个正整数N ,L ,S 。其中N 表示账户名称数量,L 表示账户名称长度,S 用来表示字符集规模大小,它的值只可能为2或64。
若S 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若S 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后N 行,每行一个长度为L 的字符串,用来描述一个账户名称。数据保证N 个字符串是两两不同的。
输出格式:
仅一行一个正整数,表示共有多少对相似的账户名称。
说明:
测试点编号 | N | L | S |
---|---|---|---|
1 | 50 | 10 | 64 |
2 | 500 | 100 | 64 |
3 | 3000 | 100 | 2 |
4 | 3000 | 100 | 64 |
5 | 30000 | 50 | 2 |
6 | 30000 | 50 | 64 |
7 | 30000 | 200 | 2 |
8 | 30000 | 200 | 64 |
9 | 30000 | 200 | 2 |
10 | 30000 | 200 | 64 |
果然我还是太naive
思路:枚举哪一位不同,取左边和右边的hash值进行比较统计
hash值先预处理
复杂度:\(O(nlognL)\)
然而这个题大家都用的是自动溢出取模,我并不知道说明时候该用这个。之前等价表达式用被卡出shi来
Code:
#include <cstdio>
#include <cstring>
#include <algorithm>
#define ll long long
using namespace std;
const int N=30010;
const ll mod=1e9+7;
const ll base=233;
pair <ll,ll> dx[N];
char c[N][203];
int n,l,s,ans;
ll f1[N][203],f2[N][203];
int main()
{
scanf("%d%d%d",&n,&l,&s);
for(int i=1;i<=n;i++)
scanf("%s",c[i]+1);
ll t=1;
for(int j=1;j<=l;j++)
{
for(int i=1;i<=n;i++)
f1[i][j]=(f1[i][j-1]+t*c[i][j])%mod;
t=(t*base)%mod;
}
t=1;
for(int j=l;j>=1;j--)
{
for(int i=1;i<=n;i++)
f2[i][j]=(f2[i][j+1]+t*c[i][j])%mod;
t=(t*base)%mod;
}
for(int i=1;i<=l;i++)
{
for(int j=1;j<=n;j++)
{
dx[j].first=f1[j][i-1];
dx[j].second=f2[j][i+1];
}
sort(dx+1,dx+1+n);
int cnt=0;
for(int j=1;j<=n;j++)
{
if(dx[j]==dx[j-1]) cnt++;
if(dx[j]!=dx[j-1])
{
ans+=(cnt-1)*cnt/2;
cnt=1;
}
}
ans+=(cnt-1)*cnt/2;
}
printf("%d\n",ans);
return 0;
}
2018.7.25