敏感词过滤 php简单实现

敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。在实现敏感词过滤的算法中,我们必须要减少运算,而 DFA 在 DFA 算法中几乎没有什么计算,有的只是状态的转换。所以想更高效的进行敏感词的过滤,需要使用 DFA 算法。感兴趣的同学可以去学习一下

但这里展示的是使用PHP实现简单的敏感词过滤,调用StringFiter类时,传入 $sorStr, 就可以将 $sorStr 中敏感的词汇转换为 ** 。
贴一个敏感词库地址,可以直接在GitHub上下载使用 https://github.com/fwwdn/sensitive-stop-words

$GLOBALS['g_badword'] = [
'考前答案', '万科', '家宝', '辛灏年', '陈胜', //此处随意列举的,可根据实际情况去修改
];
$GLOBALS['g_badword_arr'] = array_combine($GLOBALS['g_badword'], array_fill(0, count($GLOBALS['g_badword']), '**'));

/**
* 敏感词过滤
*/
class StringFiter
{
    public static function Get_Fiter($sorStr)
    {
        if(!$sorStr)
        return '';

        // 先声明
        global $g_badword_arr;

        return strtr($sorStr, $g_badword_arr);
    }
}


 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值