洛谷 P-2292 L语言(AC自动机)

博客介绍了洛谷P-2292题目,涉及使用AC自动机解决根据字典识别文章最长可理解前缀的问题。通过建立AC自动机并跟踪每个节点代表的字符串长度,逐字符匹配并利用fail边处理,确定文章在字典中的最长可识别前缀。
摘要由CSDN通过智能技术生成

洛谷 P-2292 L语言

一道比较简单的题,结果自己脑补了各种奇葩(错误)的判断,搞了一个多小时。。。

题意:用已知字典去识别一个串,求最长可识别前缀(指能将此前缀分解为字典里面的单词)

思路:

  1. 建好AC自动机,记录好每个点所代表的字符串的长度
  2. 拿要匹配的串从前往后匹配,若某个点完全不能匹配,直接退出(可以不考虑这个)
  3. 处理好什么叫“可以匹配”就好了,就是能将当前串分解为一个可识别的前缀和一个可识别的后缀即可
  4. 因此对当前字符跑fail边(即跑后缀),若“可以匹配”,则更新最长可识别前缀,并标记当前串(也是一个前缀)可识别

题目描述

标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。

一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。

例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的,因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解,而且是在字典D下能够被理解的最长的前缀。

给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。

输入格式

输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。之后的n行每行描述一个单词,再之后的m行每行描述一段文章。

其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。

输出格式

对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。

输入输出样例

输入
4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname
输出
14 (整段文章’whatisyourname’都能被理解)
6 (前缀’whatis’能够被理解)
0 (没有任何前缀能够被理解)

//#pragma comment(linker, "/STACK:102400000,102400000")
#include "bits/stdc++.h"
#define pb push_back
#define ls l,m,now<<1
#define rs m+1,r,now<<1|1
#define hhh printf("hhh\n")
#define see(x) (cerr<<(#x)<<'='<<(x)<<endl)
using namespace std;
typedef long long ll;
typedef pair<int,int> pr;
inline int read() {int x=0;char c=getchar();while(c<'0'||c>'9')c=getchar();while(c>='0'&&c<='9')x=x*10+c-'0',c=getchar();return x;}

const int maxn = 1e3+10;
const int mod = 1e4+7;
const double eps = 1e-9;

char s[maxn*maxn];
int n, m;
int trie[maxn][26], fail[maxn], ed[maxn], cnt, sl[maxn];
bool vis[maxn*maxn];

void insert() {
    int len=strlen(s), p=0;
    for(int i=0; i<len; ++i) {
        int k=s[i]-'a';
        if(!trie[p][k]) trie[p][k]=++cnt, sl[cnt]=i+1;
        p=trie[p][k];
    }
    ed[p]=1;
}

void build() {
    queue<int> q;
    for(int i=0; i<26; ++i) if(trie[0][i]) q.push(trie[0][i]);
    while(q.size()) {
        int now=q.front(); q.pop();
        for(int i=0; i<26; ++i) {
            if(trie[now][i]) {
                fail[trie[now][i]]=trie[fail[now]][i];
                q.push(trie[now][i]);
            }
            else trie[now][i]=trie[fail[now]][i];
        }
    }
}

int match() {
    int len=strlen(s+1), p=0;
    int mlen=0;
    for(int i=1; i<=len; ++i) {
        int k=s[i]-'a';
        p=trie[p][k];
        if(!p) return mlen;
        int pp;
        for(pp=p; pp&&!(vis[i-sl[pp]]&&ed[pp]); pp=fail[pp]); //跑fail边,即跑后缀
        if(pp) vis[i]=1, mlen=i;
    }
    return mlen;
}

int main() {
    //ios::sync_with_stdio(false);
    n=read(), m=read();
    for(int i=0; i<n; ++i) scanf("%s", s), insert();
    build();
    while(m--) {
        scanf("%s", s+1);
        int len=strlen(s+1);
        vis[0]=1; for(int i=1; i<=len; ++i) vis[i]=0;
        printf("%d\n", match());
    }
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
图像识别技术在病虫害检测中的应用是一个快速发展的领域,它结合了计算机视觉和机器学习算法来自动识别和分类植物上的病虫害。以下是这一技术的一些关键步骤和组成部分: 1. **数据收集**:首先需要收集大量的植物图像数据,这些数据包括健康植物的图像以及受不同病虫害影响的植物图像。 2. **图像预处理**:对收集到的图像进行处理,以提高后续分析的准确性。这可能包括调整亮度、对比度、去噪、裁剪、缩放等。 3. **特征提取**:从图像中提取有助于识别病虫害的特征。这些特征可能包括颜色、纹理、形状、边缘等。 4. **模型训练**:使用机器学习算法(如支持向量机、随机森林、卷积神经网络等)来训练模型。训练过程中,算法会学习如何根据提取的特征来识别不同的病虫害。 5. **模型验证和测试**:在独立的测试集上验证模型的性能,以确保其准确性和泛化能力。 6. **部署和应用**:将训练好的模型部署到实际的病虫害检测系统中,可以是移动应用、网页服务或集成到智能农业设备中。 7. **实时监测**:在实际应用中,系统可以实时接收植物图像,并快速给出病虫害的检测结果。 8. **持续学习**:随着时间的推移,系统可以不断学习新的病虫害样本,以提高其识别能力。 9. **用户界面**:为了方便用户使用,通常会有一个用户友好的界面,显示检测结果,并提供进一步的指导或建议。 这项技术的优势在于它可以快速、准确地识别出病虫害,甚至在早期阶段就能发现问题,从而及时采取措施。此外,它还可以减少对化学农药的依赖,支持可持续农业发展。随着技术的不断进步,图像识别在病虫害检测中的应用将越来越广泛。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值