DFA 敏感词过滤

最新推荐文章于 2024-04-28 17:45:18 发布

VIP文章 Meiko丶

最新推荐文章于 2024-04-28 17:45:18 发布

阅读量807

点赞数

分类专栏： Java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010365819/article/details/119040852

版权

对于一个游戏，如果有聊天功能，那么我们就会希望我们的聊天系统能够对玩家的输入进行判断，如果玩家的输入中含有一些敏感词汇，那么我们就禁止玩家发送聊天，或者把敏感词转换为 * 来替换。

为什么要使用 DFA 算法

设我们已经有了一个敏感词词库(从相关部门获取到的，或者网上找来的)，那么我们最容易想到的过滤敏感词的方法就是：
遍历整个敏感词库，拿到敏感词，再判断玩家输入的字符串中是否有该敏感词，如果有就把敏感词字符替换为 *

但这样的方法，我们需要遍历整个敏感词库，并且对玩家输入的字符串进行替换。而整个敏感词库中一般会有上千个字符串。而玩家聊天输入的字符串一般也就 20~30 个字符。
因此，这种方法的效率是非常低的，无法应用到真实的开发中。

而使用 DFA 算法就可以实现高效的敏感词过滤。使用 DFA 算法，我们只需要遍历一遍玩家输入的字符串即可将所有存在的敏感词进行替换。

DFA 算法原理

DFA 算法是通过提前构造出一个树状查找结构(实际上应该说是一个森林)，之后根据输入在该树状结构中就可以进行非常高效的查找。

设我们有一个敏感词库，词酷中的词汇为：
我爱你
我爱他
我爱她
我爱你呀
我爱他呀
我爱她呀
我爱她啊

那么就可以构造出这样的树状结构：

设玩家输入的字符串为：白菊我爱你呀哈哈哈

我们遍历玩家输入的字符串 str，并设指针 i 指向树状结构的根节点，即最左边的空白节点：
str[0] = ‘白’ 时，此时 tree[i] 没有指向值为 ‘白’ 的节点，所以不满足匹配条件，继续往下遍历
str[1] = ‘菊’，同样不满足匹配条件，继续遍历
str[2] = ‘我’，此时 tree[i] 有一条路径连接着 ‘我’ 这个节点，满足匹配条件，i 指向 ‘我’ 这个节点，然后继续遍历
str[3] = ‘爱’，此时 tree[i] 有一条路径连着 ‘爱’ 这个节点，满足匹配条件，i 指向 ‘爱’，继续遍历
str[4] = ‘你’，同样有路径，i

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
DFA 敏感词过滤

对于一个游戏，如果有聊天功能，那么我们就会希望我们的聊天系统能够对玩家的输入进行判断，如果玩家的输入中含有一些敏感词汇，那么我们就禁止玩家发送聊天，或者把敏感词转换为 * 来替换。为什么要使用 DFA 算法设我们已经有了一个敏感词词库(从相关部门获取到的，或者网上找来的)，那么我们最容易想到的过滤敏感词的方法就是：遍历整个敏感词库，拿到敏感词，再判断玩家输入的字符串中是否有该敏感词，如果有就把敏感词字符替换为 *但这样的方法，我们需要遍历整个敏感词库，并且对玩家输入的字符串进行替换。而整个敏感
复制链接

扫一扫

专栏目录

Meiko丶 CSDN认证博客专家 CSDN认证企业博客

码龄11年

355: 原创

4万+: 周排名

103万+: 总排名

69万+: 访问

: 等级

6381: 积分

219: 粉丝

830: 获赞

90: 评论

2683: 收藏

私信

关注

热门文章

分类专栏

算法 102篇
redis 32篇
设计模式 5篇
kafka 10篇
flowable 9篇
Java 149篇
nodejs 40篇
other 81篇
python 3篇
MySQL 46篇
机器学习 33篇
数据结构 5篇
mongodb 7篇
docker 2篇

最新评论

动态规划详解
关于不上作者榜就原神启动那件事: 兄弟你好香，看一遍就懂了
动态规划详解
hang_jian: 感谢头痒痒的感觉开始长脑子了
递归详解
chenyanmmmm: 讲的深入浅出，很适合新手慢慢去琢磨
索引下推
ddyszw: 忽略也不需要回2次啊，查询时已经有主键了，主键查完整行才是回表
索引下推
lushanlushan0026: 为什么我的就是using where; using index 就是不用索引下推我的版本也支持

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。