字典树:将字符串分别建树,就像用字典时,先找第一个数再找下面的数。
将每个字符串建树后,用红点标记字符串的最后一个字母,以表示结束。
博主比较懒,声明以下图片为借鉴其他大佬的:
trie[N][26] 为建树过程
p 为从root结点到下一个字母的层数
red[p] 记录每一层红点的个数,也就是字符串的结束
如上图所示有字符串abb,abc,bcd,bca,bc;
每个字符串的结束都标记为红点。
对代码进行一个解释:
以字符串abc为例,a的时候也就是p变为1的时候:trie[0][0]=1,p=1;
b的时候:trie[1][1]=2,p=2;
c的时候:trie[2][2]=3,p=3;
void insert(string s)
{
int p=0;
for(int i=0;i<s.size();i++)
{
int x=s[i]-'a';
if(trie[p][x]==0)
trie[p][x]=++id; //id为全局变量初始值为0.
p=trie[p][x];
}
red[p]++;
}
如上图所示:red[4]=1,red[3]=1,red[6]=1,red[8]=1,red[7]=1.
int find(string s)
{
int p=0;
int sum=0;
for(int i=0;i<s.size();i++)
{
int x=s[i]-'a';
if(trie[p][x]==0)
return sum;
p=trie[p][x];
sum+=red[p];
}
return sum;
}
当找abb字符串时,红点在p=4处,sum+=red[p]=1;同理可知其他。
例题:
给定 N 个字符串 S1,S2…SN,接下来进行 M 次询问,每次询问给定一个字符串 T ,求 S1∼SN中有多少个字符串是 T 的前缀。
输入字符串的总长度不超过 10^6,仅包含小写字母。
输入格式
第一行输入两个整数 N,M。
接下来 N 行每行输入一个字符串 Si。
接下来 M 行每行一个字符串 T 用以询问。
输出格式
对于每个询问,输出一个整数表示答案。
每个答案占一行。
数据范围
1≤N,M≤10^5
输入样例:
3 2
ab
bc
abc
abc
efg
输出样例:
2
0
代码:
#include<bits/stdc++.h>
using namespace std;
const int N=1e5+9;
int trie[N][26];
int red[N];
int id;
int find(string s)
{
int p=0;
int sum=0;
for(int i=0;i<s.size();i++)
{
int x=s[i]-'a';
if(trie[p][x]==0) //第一个字符不存在即不满足前缀,直接返回sum
return sum;
p=trie[p][x];
sum+=red[p];
}
return sum;
}
void insert(string s)
{
int p=0;
for(int i=0;i<s.size();i++)
{
int x=s[i]-'a';
if(trie[p][x]==0)
trie[p][x]=++id;
p=trie[p][x];
}
red[p]++;
}
int main()
{
int n,m;
cin>>n>>m;
string s;
for(int i=0;i<n;i++)
{
cin>>s;
insert(s);
}
string x;
for(int i=0;i<m;i++)
{
cin>>x;
cout<<find(x)<<endl;
}
return 0;
}