使用模糊自动机的近似字符串匹配

研究背景

在构建搜索算法时,我们经常需要解决近似搜索的问题。这些构造也可以通过Muthukrishnan描述的权重函数进行扩展。近似字符串匹配和搜索并不是一个新问题,它已经被多次面对和解决。通常基于Aho-Corasick自动机和网格构造,当处理文本文档、数据库或防病毒软件时经常使用。在这篇论文中,我们提出了一种技术,可用于在某些符号对彼此更相似的特殊情况下搜索或匹配字符串。这种相似性是普通搜索算法无法处理的。

研究主旨

论文提出了一种使用模糊集和模糊自动机进行近似字符串匹配的新方法,特别适用于处理符号间不同程度相似性的情况。这种方法超越了传统搜索算法的能力,可以应用于DNA序列分析、拼写检查等场景,其中符号间的相似度具有生物学或语言学意义。模糊自动机允许为特定符号对定义不同的相似度级别,从而改进字符串搜索的精确度。

研究特点

我们解释了使用模糊集和模糊自动机构建搜索算法的新方法。这种技术可用于在某些符号对彼此更相似的特殊情况下搜索或匹配字符串。我们展示了样本情况,这些情况将使用这种类型的搜索。然后我们定义了一个模糊自动机以及我们需要的一些基本构造。我们继续定义基于模糊自动机的近似字符串匹配算法,并对可用于近似搜索的模糊-网格结构添加了一些注释。

文章出处 使用模糊自动机的近似字符串匹配

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值