php 对全角字符的过滤,php在做敏感词过滤时怎么解决用特殊符号分割、简繁体、半角全角,来绕开过滤的问题?...

彻底地过滤敏感词

回复内容:

彻底地过滤敏感词

过滤和谐词其实并不是一个好策略,有一万种说出敏感词的方法,就一定会有第一万零一种,如果你反复设置程序去和谐这些词,最后会发现,你的会员连最基本的一些话都不能发了。和谐没有终极解决方案,却能最终作茧自缚,自缚双手。对付这些内容最佳的方案还是靠人工,如果你的系统用户比较多,信息产生得比较快,可以参考参考微博的社区委员会制度,通过发动一些热心的会员来辅助管理内容。

人工审核吧

上有政策 下有对策

很难通过程序完全过滤全部敏感词(特殊分隔、简繁等)

你需要正则表达式。

$content = "新开的淘[防和谐]宝网店欢迎光顾!";

preg_replace('/淘.{0,6}宝/uU', '****', $content);

用以上的正则表达式,只要“淘”和“宝”中间有0到6个字符,管你什么字符,照和谐不误。

更多用法请自行学习正则表达式。

这种要看策略了,不过大部分的都还是机器+人工的方式来处理,没法用机器100%处理掉敏感信息

关键词过滤容易误杀,而且总有方法绕过,所以只能用来做初步过滤,最终还是要靠人工来审核

相关标签:php

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值