必备技能: trie + KMP
文章目录
1. 结构体
cnt记录该结点的单词数,fail失配,son为子结点
struct node{
ll cnt,fail,son[26];
}a[manx];
2. 添加模式串
void add(string s){
ll n=s.size(),u=1,v;
for(int i=0;i<n;i++){
v=s[i]-'a';
if(!a[u].son[v]) a[u].son[v]=++id;
u=a[u].son[v];
}
a[u].cnt++;
}
3. 求失配指针
id为结点编号,因为以1为根扩展出26个结点,所以从1开始编号
用数组q+双指针模拟队列
fail其实就是指向最长当前字符串的后缀
有两种情况: a[u].son[i] 存在与否
如果存在直接bfs即可,不存在的话需要把a[u].son[i]的falil指向u的失配指针的同一个字母儿子,这样可以保证a[u].son[i]指向一个实际存在的结点,使树成为trie图。
ll id=1,q[manx];
void getfail(){
for(int i=0;i<26;i++) a[0].son[i]=1; //初始化0的所有儿子都是1
ll l=0,r=1; q[1]=1, a[1].fail=0;
while(l<r){
ll u=q[++l];
for(int i=0;i<26;i++){
ll f=a[u].fail; ll v=a[u].son[i];
if(!v){ a[u].son[i]=a[f].son[i]; continue; }
a[v].fail=a[f].son[i];
q[++r]=v;
}
}
}
4. 匹配文本串
跟trie一样的操作即可,中间多了转移指针和防止重复走而打上-1的操作。
ll query(string s){
ll ans=0,n=s.size(),u=1;
for(int i=0;i<n;i++){
ll v=s[i]-'a';
ll k=a[u].son[v];
while(k>1&&a[k].cnt!=-1){
ans+=a[k].cnt; a[k].cnt=-1; k=a[k].fail;
}
u=a[u].son[v];
}
return ans;
}
ends:模板1 统计出现的模式串个数
const int manx=2e6+5;
struct node{
ll cnt,fail,son[26];
}a[manx];
ll id=1,q[manx];
void add(string s){
ll n=s.size(),u=1,v;
for(int i=0;i<n;i++){
v=s[i]-'a';
if(!a[u].son[v]) a[u].son[v]=++id;
u=a[u].son[v];
}
a[u].cnt++;
}
void getfail(){
for(int i=0;i<26;i++) a[0].son[i]=1;
ll l=0,r=1; q[1]=1, a[1].fail=0;
while(l<r){
ll u=q[++l];
for(int i=0;i<26;i++){
ll f=a[u].fail; ll v=a[u].son[i];
if(!v){ a[u].son[i]=a[f].son[i]; continue; }
a[v].fail=a[f].son[i];
q[++r]=v;
}
}
}
ll query(string s){
ll ans=0,n=s.size(),u=1;
for(int i=0;i<n;i++){
ll v=s[i]-'a';
ll k=a[u].son[v];
while(k>1&&a[k].cnt!=-1){
ans+=a[k].cnt; a[k].cnt=-1; k=a[k].fail;
}
u=a[u].son[v];
}
return ans;
}
int main(){
io; ll p; cin>>p; string s;
while(p--) cin>>s,add(s);
getfail();
cin>>s;
cout<<query(s)<<endl;
return 0;
}
ends:模板2 统计出现次数最多的模式串(带初始化)
#include<bits/stdc++.h>
#define mp make_pair
#define pb push_back
#define ll long long
#define fi first
#define se second
#define inf 0x3f3f3f3f
#define io std::ios::sync_with_stdio(false),cin.tie(0),cout.tie(0)
using namespace std;
const int mo=998244353; const int mod=1000000007;
const int manx=2e6+5;
struct node{
ll flag,fail,son[26];
void clear(){memset(son,0,sizeof(son));fail=flag=0;}
}a[manx];
ll id=1,q[manx],cnt,vis[manx];
string c[manx];
void add(string s){
ll n=s.size(),u=1,v;
for(int i=0;i<n;i++){
v=s[i]-'a';
if(!a[u].son[v]) a[u].son[v]=++id;
u=a[u].son[v];
}
a[u].flag=cnt;
}
void getfail(){
for(int i=0;i<26;i++) a[0].son[i]=1;
ll l=0,r=1; q[1]=1, a[1].fail=0;
while(l<r){
ll u=q[++l];
for(int i=0;i<26;i++){
ll v=a[u].son[i]; ll f=a[u].fail;
if(!v){ a[u].son[i]=a[f].son[i]; continue; }
a[v].fail=a[f].son[i];
q[++r]=v;
}
}
}
void query(string s){
ll n=s.size(),u=1;
for(int i=0;i<n;i++){
ll v=s[i]-'a';
ll k=a[u].son[v];
while(k>1){
if(a[k].flag) vis[a[k].flag]++;
k=a[k].fail;
}
u=a[u].son[v];
}
}
void init(){
for(int i=0;i<=id;i++) a[i].clear();
for(int i=1;i<=id;i++) vis[i]=0;
id=1;
}
int main(){
io; ll p;
while(cin>>p&&p){
init();
for(cnt=1;cnt<=p;cnt++) cin>>c[cnt],add(c[cnt]);
getfail();
string s; cin>>s;
query(s);
ll ans=0;
for(int i=1;i<=p;i++)
if(vis[i]>ans) ans=vis[i];
cout<<ans<<endl;
for(int i=1;i<=p;i++)
if(vis[i]==ans) cout<<c[i]<<endl;
}
return 0;
}
ends:模板3 统计每个模式串出现次数(拓扑优化实现结点至多访问一次,dp延迟累加计算贡献)
#include<bits/stdc++.h>
#define mp make_pair
#define pb push_back
#define ll long long
#define fi first
#define se second
#define inf 0x3f3f3f3f
#define io std::ios::sync_with_stdio(false),cin.tie(0),cout.tie(0)
using namespace std;
const int mo=998244353; const int mod=1000000007;
const int manx=2e6+5;
struct node{
ll flag,fail,son[26],ans;
void clear(){memset(son,0,sizeof(son));fail=flag=0;}
}a[manx];
ll id=1,q[manx],cnt,dp[manx],d[manx],vis[manx];
string c[manx];
void add(string s){
ll n=s.size(),u=1,v;
for(int i=0;i<n;i++){
v=s[i]-'a';
if(!a[u].son[v]) a[u].son[v]=++id;
u=a[u].son[v];
}
if(!a[u].flag) a[u].flag=cnt;
vis[cnt]=a[u].flag;
}
void getfail(){
for(int i=0;i<26;i++) a[0].son[i]=1;
ll l=0,r=1; q[1]=1, a[1].fail=0;
while(l<r){
ll u=q[++l];
for(int i=0;i<26;i++){
ll v=a[u].son[i]; ll f=a[u].fail;
if(!v){ a[u].son[i]=a[f].son[i]; continue; }
a[v].fail=a[f].son[i]; d[a[v].fail]++;
q[++r]=v;
}
}
}
void query(string s){
ll n=s.size(),u=1;
for(int i=0;i<n;i++){
ll v=s[i]-'a';
u=a[u].son[v];
a[u].ans++;
}
}
void tp(){
ll l=0,r=0;
for(int i=1;i<=id;i++) if(!d[i]) q[++r]=i;
while(l<r){
ll u=q[++l];
dp[a[u].flag]=a[u].ans;
ll v=a[u].fail; a[v].ans+=a[u].ans; d[v]--;
if(!d[v]) q[++r]=v;
}
}
int main(){
io; ll p;
cin>>p;
for(cnt=1;cnt<=p;cnt++) cin>>c[cnt],add(c[cnt]);
getfail();
string s; cin>>s;
query(s);
tp();
for(int i=1;i<=p;i++)
cout<<dp[vis[i]]<<endl;
return 0;
}