如何屏蔽违禁词语

PHP屏蔽过滤指定关键字的方法

实现思路:

一、把关键字专门写在一个文本文件里,每行一个,数量不限,有多少写多少。
二、PHP读取关键字文本,存入一个数组
三、遍历关键字数组,挨个用strpos函数去看看内容有没有关键字,如果有,返回true,没有则返回false

PHP代码如下:

复制代码 代码如下:
/* PHP中用strpos函数过滤关键字 */
// 关键字过滤函数
function keyWordCheck($content){
// 去除空白
$content = trim($content);
// 读取关键字文本
$content = @file_get_contents('keyWords.txt');
// 转换成数组
$arr = explode("n", $content);
// 遍历检测
for($i=0,$k=count($arr);$i<$k;$i++){
// 如果此数组元素为空则跳过此次循环
if($arr[$i]==''){
continue;
}
// 如果检测到关键字,则返回匹配的关键字,并终止运行
if(@strpos($str,trim($arr[$i]))!==false){
//$i=$k;
return $arr[$i];
}
}
// 如果没有检测到关键字则返回false
return false;
}
$content = '这里是要发布的文本内容。。。';
// 过滤关键字
$keyWord = keyWordCheck($content);
// 判断是否存在关键字
if($keyWord){
echo '你发布的内容存在关键字'.$keyWord;
}else{
echo '恭喜!通过关键字检测';
// 往下可以进行写库操作完成发布动作。
}

例子2 (注:中文关键字过滤时使用的关键字文件为utf-8编码)

复制代码 代码如下:
/**
 * 被禁止的关键字检测
 *
 * @param string $string  要检测的字符串
 * @param string $fileName 屏蔽关键字文件
 * @return bool
 */
function banwordCheck( $string, $fileName )
{
 if ( !($words = file_get_contents( $fileName )) ){
  die('file read error!');
 }
 $string = strtolower($string);
 $matched = preg_match('/'.$words.'/i', $string, $result);
 if ( $matched && isset($result[0]) && strlen($result[0]) > 0 )
 {
  if ( strlen($result[0]) == 2 ){
   $matched = preg_match('/'.$words.'/iu', $string, $result);
  }
  if ( $matched && isset($result[0]) && strlen($result[0]) > 0 ) {
   return true;
  }else{
   return false;
  } 
 }else{
  return false;
 }
}
$content = '测试关键字';
if ( banwordCheck($content, './banwords.txt') ){
 echo "matched! ";
}else{
 echo "no match! ";
}



PHP的一个过滤敏感词或脏话的方法


主要使用了  int substr_count ( string haystack, string needle [, int offset [, int length]] )  这个方法,这个方法遍历待测的字符串$str中有没有$allergicWord数组中所包含的敏感词: 

  1. $allergicWord = array('脏话','骂人话');  
  2. $str = '这句话里包含了脏话和骂人话';  
  3.   
  4. for ($i=0;$i<count($allergicWord);$i++){  
  5.     $content = substr_count($str$allergicWord[$i]);  
  6.     if($content>0){  
  7.         $info = $content;  
  8.         break;  
  9.      }  
  10. }  
  11.   
  12. if($info>0){  
  13.    //有违法字符   
  14.    return TRUE;  
  15. }else{  
  16.    //没有违法字符  
  17.    return FALSE;  
  18. }  

如果需要将出现的敏感词替换,比如替换###或者***可以结合substr_replace ( mixed string, string replacement, int start [, int length] )方法使用



=================================================================

  1. 关键字的存放形式为txt,txt文件中以这样形式存放:|赌博机|卖血|出售肾|出售器官|眼角膜  
  2.   
  3. <?php  
  4. function Filter_word( $str$fileName )     
  5. {     
  6.     if ( !($words = file_get_contents$fileName )) ){     
  7.         die('file read error!');     
  8.     }     
  9.     $str = strtolower($str);  
  10.  //var_dump($words);  
  11.  $word = preg_replace("/[1,2,3]\r\n|\r\n/i"''$words);  
  12.  //$wor = substr($word,0,-1);  
  13.  //$w = preg_replace("|/|i", '\/', $word);  
  14.  //echo "<pre>";  
  15.  //var_dump($w);  
  16.  //$words = "赌博机|卖血|出售肾|出售器官|眼角膜";  
  17.     $matched = preg_replace('/'.$word.'/i''***'$string);  
  18.  return $matched;   
  19. }     
  20.     
  21. $content = "<a href='#'>我要卖血fsdf卖血d 赌博机wo眼口交膜</a>";     
  22. if ($result = Filter_word($content'./words.txt') ){  
  23.  echo $result;  
  24.     echo "替换成功 ";     
  25. }else{     
  26.     echo "替换失败! ";     
  27. }   
  28.   
  29.    
  30.   
  31. ?> 
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值