cocos脏话过滤_字符串多模式精确匹配（脏字/敏感词汇/关键字过滤算法）——TTMP算法之实战F模式...

憨憨的祝小铁

于 2021-02-06 16:15:26 发布

阅读量684

点赞数

文章标签： cocos脏话过滤

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29740921/article/details/113893633

版权

本文介绍了TTMP算法在Cocos脏话过滤中的F模式应用，强调了算法的效率和代码优化。文章通过介绍FastDict、FastList等核心数据结构，阐述了算法如何提高关键字过滤的查找速度。虽然简化后的代码降低了可读性，但作者提到可以通过优化进一步提升性能。文中还探讨了哈希表的原理和冲突解决，为理解算法提供了帮助。

摘要由CSDN通过智能技术生成

前面那么多篇文章都太抽象，这次来一个稍微实际一点的。F模式是我实际上选用的模式，对该模式我做了不少实际的测试，因此代码也算是比较稳定的。不过由于实际上为了得到该算法的效率，算法本身做了一些优化，对于初学者，理解起来可能会有点困难，因此不适合直接贴原始代码。为了便于大家理解，这里出示的代码会比较好读，但是并不能取得我宣称的效果。大家可以在此基础上进行一定的优化，以便达到你所想要的性能。我目前版本的性能大约是：

T2080 1.73GHz(双核) 笔记本 1.5GB 内存 Vista Ultra 特性全开(集成显卡)

15M字符/秒

不过即便经过精简，这个算法的代码也还是比一般的算法要复杂：除了算法本身所在的类，它还需要5个额外的数据结构，以及一个特殊枚举的支持。这几个额外的数据结构包括：

FastDict

FastList

FastQueue

FastWorkItem

FastScanResult

一个额外的枚举是

CharacterType

其中前面四个数据类，以及那个枚举对于本算法是至关重要的。下面首先讲解一下这几个数据结构和枚举：

//hashcode对应字符串列表的字典publicclassFastDict : Dictionary

{

//该hashcode对应的字符串最大长度是多少publicintMaxCharacterLength;

}

//相同hashcode都有哪些字符串publicclassFastList : List

{

}

//一个起始字符记录(也就是可能需要处理的数据)publicclassFastWorkItem

{

publicFastWorkItem(intindex,intmaxEndIndex,uintlowPartDelta)

{

Index=index;

MaxEndIndex=maxEndIndex;

LowPartDelta=lowPartDelta;

}//起始字符在待检文本中的位置publicintIndex;

//该起始字符所对应的关键字条目的最远结束位置publicintMaxEndIndex;

//该记录所对应的(与前一条记录的)hashcode差值publicuintLowPartDelta;

}

//待处理数据队列publicclassFastQueue:Queue

{

}

//扫描结果publicclassFastScanResult

{

publicFastScanResult(stringword,intindex)

{

最低0.47元/天解锁文章

憨憨的祝小铁

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
cocos脏话过滤_字符串多模式精确匹配（脏字/敏感词汇/关键字过滤算法）——TTMP算法之实战F模式...

前面那么多篇文章都太抽象，这次来一个稍微实际一点的。F模式是我实际上选用的模式，对该模式我做了不少实际的测试，因此代码也算是比较稳定的。不过由于实际上为了得到该算法的效率，算法本身做了一些优化，对于初学者，理解起来可能会有点困难，因此不适合直接贴原始代码。为了便于大家理解，这里出示的代码会比较好读，但是并不能取得我宣称的效果。大家可以在此基础上进行一定的优化，以便达到你所想要的性能。我目前版本的性...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。