字典树一般用于字符串的匹配,当数量多的时候效率还是挺明显的。
这里以一道洛谷的题为例子,https://www.luogu.org/problem/P2580
题目的大致意思时,先给你n个字符串,然后再给你m个字符串,求这m个字符串是否在n个字符串中出现过或是否重复出现了。
若采用朴素一对一的比较方式,那时间复杂度就是O(nxmx‘字符串长度’),所以还是算了。
解决的方法便是利用字典树,将n个字符串搭建成一个字典树。
什么是字典树????比如字符串(ab,ac,b,bca,bcd)构成的字典树如下
红色标记的结点即该结点为某一字符串的结束结点,注意字典树的根结点不存任何字符
构建完字典树后,后面的操作就简单了。待查询的m个字符串依次从根节点开始查询,当前结点存在该字符,则更新当前位置到该字符所在结点,否则就证明查询不到。到最后一个字符匹配且该结点是结束结点,说明查询成功。
下面是题目的代码
#include<iostream>
using namespace std;
int n,m,cnt;
string s;
struct node
{
int vis[26];
int state;//0 普通节点 1 结束节点 2 结束且已访问
}tried[500010];
void Build_tree(string s)
{
int len=s.length();
int now=0;
for(int i=0;i<len;i++){
if(tried[now].vis[s[i]-'a']==0){
tried[now].vis[s[i]-'a']=++cnt;
}
now=tried[now].vis[s[i]-'a'];
}
tried[now].state=1;
}
void Query_str(string s)
{
int len=s.length();
int now=0;
for(int i=0;i<len;i++){
if(tried[now].vis[s[i]-'a']){
now=tried[now].vis[s[i]-'a'];
if(i==len-1&&tried[now].state==1){
cout<<"OK"<<endl;
tried[now].state=2;
}
else if(i==len-1&&tried[now].state==2){
cout<<"REPEAT"<<endl;
}
}
else{
cout<<"WRONG"<<endl;
break;
}
}
}
int main()
{
cin>>n;
for(int i=0;i<n;i++){
cin>>s;
Build_tree(s);
}
cin>>m;
for(int i=0;i<m;i++){
cin>>s;
Query_str(s);
}
return 0;
}