题意:给定两本字典,每本字典最多1000个单词,每个单词最多1000长度,每本字典的总长度最多10^5长度。
现在希望取第一本字典的单词的所有前缀(非空),和第二本字典单词的所有后缀(非空),组成一个新的单词。求出能组成的新单词总数。
分析: 统计第一本字典单词的所有不同前缀数s1,第二本单词不同后缀数s2,理想状态下总单词为s1 * s2, 但是前缀和后缀组合起来,可能会重复产生相同的单词。统计两次字典树中每个字符(除去首结点,因为不能有非空前后缀)出现的次数,cnt1[i] * cnt2[i] 表示因i字符,导致的重复计算。
#include <iostream>
#include <algorithm>
#include <cmath>
#include<functional>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <string>
#include <vector>
#include <set>
#include <queue>
#include <stack>
#include <climits>//形如INT_MAX一类的
#define MAX 1005
#define INF 0x7FFFFFFF
using namespace std;
int n,m,cnt,root;
char a[MAX][MAX],b[MAX][MAX];
char tmp[MAX];
long long cnt1[30], cnt2[30];
struct Trie {
int next[27];
void init() {
memset(next,0,sizeof(next));
}
}tr[111111];
void init() {
tr[0].init();
cnt = 0;
root = 0;
}
void insert(char *key,int kind) {
int p = root;
for(int i=0; key[i]; i++) {
int t = key[i] - 'a';
if(tr[p].next[t] == 0) {
tr[p].next[t] = ++ cnt;
tr[cnt].init();
if(i != 0) {
if(kind == 1) cnt1[t] ++;
else cnt2[t] ++;
}
}
p = tr[p].next[t];
}
}
int main() {
while(scanf("%d%d",&n,&m)) {
if(n == 0 && m == 0) break;
for(int i=0; i<n; i++) scanf("%s",a[i]);
for(int i=0; i<m; i++) scanf("%s",b[i]);
init();
memset(cnt1,0,sizeof(cnt1));
memset(cnt2,0,sizeof(cnt2));
for(int i=0; i<n; i++) {
insert(a[i],1);
}
long long s1 = cnt;
init();
for(int i=0; i<m; i++) {
int len = strlen(b[i]);
for(int j=0; j<len; j++) {
tmp[j] = b[i][len-1-j];
}
tmp[len] = '\0';
insert(tmp,2);
}
long long s2 = cnt;
long long ans = s1 * s2;
//cout << s1 << ' ' << s2 << endl;
for(int i=0; i<26; i++) {
ans -= cnt1[i] * cnt2[i];
}
printf("%lld\n",ans);
}
return 0;
}