PHP 实现敏感词 / 停止词 过滤(附敏感词库)PHP实现了敏感词/停用词过滤(带敏感词库),过滤敏感单词和字符是网站,的一项基本功能,因此有必要设计一个好的、高效的过滤算法。在敏感词过滤算法中,必须减少计算量,而DFA算法中几乎没有计算量,只有状态转移。因此,需要DFA算法来更高效地过滤敏感词。
整理过滤函数代码如下:
/**
*注意:[多过滤词过滤字符中的敏感词]
*AuthorHeZe
*日期2021/1/614:48
*@param$list一维数组过滤词[‘小明’,’小红’,’大白’,’小白’,’小黑’,’我’,’你’];
*@param$string输入文本,就像小白喜欢小黑喜欢的大黄一样
*@returnstring过滤后的单词,如**喜欢*喜欢大黄
*/
functionDoFilterWords($list,$string,$symbol=’* ‘)
{
$ count=0;//非法字数
$敏感词=’ ‘;//非法词语
$ stringAfter=$ string//替换后的内容
$pattern=’/’。内爆(‘ | ‘,$list)。/I ‘;//定义正则表达式
If (preg _ match _ all ($ pattern,$ string,$ matches)){//匹配结果
$ PatternList=$ matches