白书上的题,该题目不难,但是我还是要发这篇文章,因为这个题的细节,把我wa的死去活来,所以特发这篇文章纪念死去的脑细胞。
题意:输入n个字符串,这些字符串要求两两比较,求总的比较次数,两个字符串的比较次数等于相同的前缀*2+1,如,"than"和"that"要比较7次,“there”和"the"也是7次。
n的范围过大,暴力肯定不行,用字典树可以解决,边插入边统计比较次数,val数组记录每一个节点已经插入了字符的个数,从一个节点插到其子节点,比较次数+=val[ u ]*2+val[ u ]-val[ son ],但是,有个至关重要的细节,就是插入字典树并且统计时,遍历字符串不仅遍历到最后一个有效字符,还要多遍历一个'\0',为什么,想想字典树已经有"there",再插入"the",其比较次数为什么是7就好了。
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=1000*4000+100;
long long ans;
int pre;
struct Trie
{
int ch[maxn][65];
int val[maxn];
int sz;
void init()
{
memset(ch[0],0,sizeof(ch[0]));
memset(val,0,sizeof(val));
sz=1;
ans=0;
}
int index(char c)
{
if(c == '\0')
return 62;
if(c>='a'&&c<='z')
return c-'a';
if(c>='A'&&c<='Z')
return c-'A'+26;
return c-'0'+52;
}
void insert(char* s)
{
int u=0,n=strlen(s);
for(int i=0;i<=n;i++)//至关重要,这里是<=,不是<,要多遍历一个'\0' !!!!
{
int c=index(s[i]);
if(!ch[u][c])
{
memset(ch[sz],0,sizeof(ch[sz]));
val[sz]=0;
ch[u][c]=sz++;
}
u=ch[u][c];
ans+=val[u]*2;
ans+=pre-val[u];
pre=val[u];
val[u]++;
}
}
}a;
int main()
{
int n,i,kase=0;
char s[1005];
while(~scanf("%d",&n)&&n)
{
a.init();
for(i=0;i<n;i++)
{
pre=i;
scanf("%s",s);
a.insert(s);
}
printf("Case %d: %lld\n",++kase,ans);
}
}