1.什么是trie?
trie树,又名前缀树。用来保存字符串集合。如图所示。
(图是网上找的)
图中就是一个trie,树,每个节点都是一个字母,当我们深入到一个单词结束位置的时候,我们就获得了一个单词。例如我们从根节点出发,走到“t"再走到”e",再走到“a",就获得了单词"tea"。
2.trie树有什么用?
如果你要找一些单词的公共前缀之类的,反正是和前缀有关的问题都很好用,比普通的算法节约了许多时间。只需要深入这棵树即可,不用枚举每一个字符串。
3.trie树怎么代码实现呢?
如果你对于指针和在struct里面写函数很熟练的话,可以去看其他博客,他们写的代码比我的好看多了。听说还有双数组的trie,我有空再瞧一瞧。因为我无论是指针还是struct都不太懂,所以用了这个代码。具体思路还是很简单的,运用了多叉转二叉的方法(听说可以省空间?但是相应的时间也会耗费的多一些)
所谓多叉转二叉,就是左边是孩子右边是兄弟,最坏的情况下,我们需要查找一个节点的所有兄弟。
1.建立trie树
寻找所有的兄弟,如果有这个字符,记录位置,如果没有,新建节点。
代码:
void build(const char *s){
int i,j,na=strlen(s),from=0,to,bj;
for(i=0;i<na;i++){
to=l[from];bj=0;
while(to){
if(num[to]==s[i]){//如果找到了
bj=1;break;}
to=r[to];
}
if(bj==1){
from=to;
}
else {//新建节点
sum++;num[sum]=s[i];
r[sum]=l[from];
l[from]=sum;
from=sum;
}
}
flag[from]=1;//标记:在from的位置上形成了一个单词
}
2.查找单词
和建立差不多啦....
代码:
void find(int x){
int i,j,from=0,to,bj;
for(i=x;i<lon;i++){
to=l[from];bj=0;
while(to){
if(num[to]==a[i]){
bj=1;break;
}
to=r[to];
}
if(bj==1){
from=to;
if(flag[to]==1){f[i]=1;}//标记f位置找到了单词
}
else break;
}
}
4.题目推荐
模板题:codevs2052/洛谷P1470最长前缀,这题好像暴力能过,不过精益求精的我们还是写trie吧
HDU1251
《训练指南》里刘汝佳推荐的题目:uva11732,uva1041
最长前缀代码:
#include<iostream>
#include<algorithm>
#include<string>
#include<vector>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<queue>
#include<climits>
using namespace std;
char ss[77],a[200005];
int l[4000005],r[4000005];
int sum=0,lon=0;
bool f[200005],flag[4000005];
char num[4000005];
void build(const char *s){
int i,j,na=strlen(s),from=0,to,bj;
for(i=0;i<na;i++){
to=l[from];bj=0;
while(to){
if(num[to]==s[i]){
bj=1;break;}
to=r[to];
}
if(bj==1){
from=to;
}
else {
sum++;num[sum]=s[i];
r[sum]=l[from];
l[from]=sum;
from=sum;
}
}
flag[from]=1;
}
void find(int x){
int i,j,from=0,to,bj;
for(i=x;i<lon;i++){
to=l[from];bj=0;
while(to){
if(num[to]==a[i]){
bj=1;break;
}
to=r[to];
}
if(bj==1){
from=to;
if(flag[to]==1){f[i]=1;}
}
else break;
}
}
int main()
{
int i,j,ans=0;
while(1){
scanf("%s",ss);
if(ss[0]=='.')break;
build(ss);
}
while(scanf("%s",ss)!=EOF){
strcat(a,ss);
}
lon=strlen(a);
find(0);
for(i=1;i<lon;i++){
if(f[i-1]==1){
find(i);ans=i;
}
}
if(f[lon-1]==1)ans=lon;
printf("%d",ans);
return 0;
}
uva11732代码:
#include<iostream>
#include<algorithm>
#include<string>
#include<vector>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<queue>
#include<climits>
using namespace std;
int val[4000005],flag[4000005];
int l[4000005],r[4000005];
char num[4000005];
int n=0,m,sum=0;
long long ans;
void find(const char *s){
int i,j,na=strlen(s);
int from=0,to,bj;
ans+=val[0];
val[0]++;
for(i=0;i<na;i++){
bj=0;
to=l[from];
while(to){
if(num[to]==s[i]){bj=1;break;}
to=r[to];
}
if(bj==0){
sum++;
r[sum]=l[from];l[from]=sum;
num[sum]=s[i];
l[sum]=0;
flag[sum]=0;
val[sum]=1;
from=sum;
}
else {
ans+=val[to]*2;val[to]++;from=to;
}
}
ans+=flag[from];
flag[from]++;
}
char ss[1001];
int main()
{
int i,j;
while(scanf("%d\n",&n)&&n){
m++;ans=0;sum=0;l[0]=0;r[0]=0;val[0]=0;flag[0]=0;
for(i=1;i<=n;i++){
scanf("%s",ss);
find(ss);
}
printf("Case %d: %lld\n",m,ans);
}
return 0;
}