敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。在实现敏感词过滤的算法中,我们必须要减少运算,而 DFA 在 DFA 算法中几乎没有什么计算,有的只是状态的转换。所以想更高效的进行敏感词的过滤,需要使用 DFA 算法。感兴趣的同学可以去学习一下
但这里展示的是使用PHP实现简单的敏感词过滤,调用StringFiter类时,传入 $sorStr, 就可以将 $sorStr 中敏感的词汇转换为 ** 。
贴一个敏感词库地址,可以直接在GitHub上下载使用 https://github.com/fwwdn/sensitive-stop-words
$GLOBALS['g_badword'] = [
'考前答案', '万科', '家宝', '辛灏年', '陈胜', //此处随意列举的,可根据实际情况去修改
];
$GLOBALS['g_badword_arr'] = array_combine($GLOBALS['g_badword'], array_fill(0, count($GLOBALS['g_badword']), '**'));
/**
* 敏感词过滤
*/
class StringFiter
{
public static function Get_Fiter($sorStr)
{
if(!$sorStr)
return '';
// 先声明
global $g_badword_arr;
return strtr($sorStr, $g_badword_arr);
}
}