工厂工作手册

题目描述
 工厂工作手册,你听说过么?小明把工厂工作手册全部摘抄了下来并把它变成了一个长度不超
过 10^5 的字符串 S,小明还有一个包含 n 个单词的列表,列表里的 n 个单词记为 t1⋯tN。
他希望从 S 中删除这些单词。
 小明每次在 S 中找到第一个出现的列表中的单词,然后从 S 中删除这个单词。他重复这个操作
直到 S 中没有列表里的单词为止。需要注意的是删除一个单词后,后面的紧跟着的字符和前面
的字符连接起来可能再次出现列表中出现的单词。并且小明注意到列表中的单词不会出现一个
单词是另一个单词子串的情况。  请你帮助小明输出删除后的 S。
 输入格式:第一行输入一个字符串 S(1≤∣S∣≤105)。第二行输入一个整数 N(1≤N≤2000)。接
下来的 N 行,每行输入一个字符串,第 i 行的字符串是 ti。
 N 个字符串的长度和小于 105。注意:输入的字符串仅包含小写字母。
 输出格式:答案输出一行,输出操作后的 S。
 样例输入
 oorjskorzorzzooorzrzrzr
 2
 orz
 jsk
 样例输出
 or

初步分析
题目的要求是每次删除第一个出现在列表中的单词。并且每次删除之后,删除单词的两边字母也有可能会重新拼接成新的单词。这道题如果从最原始的思路去想的话,可能想的是Trie树去搜索每一个列表中的单词然后返回节点的位置(终端节点越小字符串越靠前),然后再删除节点最小的那个字符串。然后重复操作。但是这样的话每一次删除我们都要把所有的字符串搜索完,复杂度其实是很大的。如果单词表里一共有N个单词,且字符串里一共需要删除M次单词。(查找一个单词并删除它的时间复杂度可以视为常数)。那么总共的时间复杂度就是O(N*M)。如果单词表里的单词比较多并且M也比较多的话。可能就会被卡住。所以我们采用AC自动机+栈来优化这道题。

解题思路
1,首先我们得定义一个数组len[i]它记录Trie树中终端点i所代表的字符串的长度。用char stack[],一个手动栈来存储输入的字符串字符,不过并不是输入之后全部一下存入栈中,而是每压进一个我们就进行一次Trie树搜索和删除(如果含有单词表的单词的话,没有的话就不用管它继续压入字母)

2,然后我们知道AC自动机能够查出一个字符串里面含有单词表里的单词每个有多少个(如果不知道AC自动机的同学可以先看看最下面的预备知识)。所以就不用每次去遍历完N个单词了。在进行统计的时候,要记录Trie树上的第一个出现的终端点x(及在单词表中出现的单词)并返回它的len[x]值。然后我们就从stack中弹出len[x]个元素,然后再重复压栈,搜索,删除…重复下去。直到搜索不到为止。

直接上代码

#include <iostream>
#include <string.h>
#include <queue>
using namespace std;
const int MAX_N=10000;
const int MAX_C=26;
queue<char > q;

//建立AC自动机
typedef struct ac_automaton{
    int ch[MAX_N][MAX_C];
    int cnt[MAX_N];
    int fail[MAX_N];
    int len[MAX_N];
    int tot;

    void init(){
        memset(ch,-1, sizeof(ch));
        memset(cnt,0, sizeof(cnt));
        memset(fail,0, sizeof(fail));
        memset(len,0, sizeof(len));
        tot=0;
    }

    void insert(char* str){
        int p=0;
        for(int i=0;str[i];++i){
            if(ch[p][str[i]-'a']==-1){
                ch[p][str[i]-'a']=++tot;
            }
            p=ch[p][str[i]-'a'];
        }
        cnt[p]++;
        len[p]=strlen(str);
    }

    void build(){
        int l=0,r=0,q[MAX_N];
        for(int i=0;i<MAX_C;++i){
            if(ch[0][i]==-1){
                ch[0][i]=0;
            }
            else
                q[r++]=ch[0][i];
        }

        while(l<r){
            int p=q[l++];
            for(int i=0;i<MAX_C;i++){
                if(ch[p][i]==-1){
                    ch[p][i]=ch[fail[p]][i];
                }
                else{
                    fail[ch[p][i]]=ch[fail[p]][i];
                    q[r++]=ch[p][i];
                }
            }
        }
    }

    int count(char* str){
        int p=0;
        for(int i=0;str[i];++i){
            p=ch[p][str[i]-'a'];
            int temp=p;
            while(temp){
                if(cnt[temp]>0)
                    return len[temp];
                temp=fail[temp];
            }
        }
        return 0;
    }
}AC_AuTomaton;
int main() {
    AC_AuTomaton arr;
    arr.init();

    char temp[MAX_N];
    scanf("%s",temp);
    for(int i=0;i<strlen(temp);++i){
        q.push(temp[i]);
    }

    int n;
    cin>>n;
    for(int i=0;i<n;++i){
        scanf("%s",temp);
        arr.insert(temp);
    }
    arr.build();

    char stack[MAX_N];
    int top=0;
    while(!q.empty()){
        stack[top++]=q.front();
        stack[top]='\0';
        q.pop();
        int x=arr.count(stack);
        while( x !=0 ){
            top-=x;
            stack[top]='\0';
            x=arr.count(stack);
        }
    }

    cout<<stack;

    return 0;
}

最后我们分析一下时间复杂度,假设字符串长度为S,所以要进行S次压栈,搜索,删除,但是压栈和删除都是常数复杂度。而搜索的话几乎也是常数复杂度(平均性能)。所以整体的时间复杂度大概就是O(S)线性复杂度。已经非常快了。几乎能过所有相同类型的题。

预备知识
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述
如果看上去不太明白的同学,可以看看这位大佬的,我也是看的他的才看懂的。https://blog.csdn.net/bestsort/article/details/82947639

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值