敏感词过滤是随着互联网社区发展,一种阻止网络犯罪和网络暴力的技术手段。通过对可能存在犯罪或网络暴力,对可能的关键词进行有针对性的筛查和屏蔽。
很多时候我们能够防患于未然,把后果严重的犯罪行为扼杀于萌芽之中。随着互联网社区和UGC应用的不断发展和变化,敏感词过滤系统(尤其是针对传奇、SLG类型的游戏黑产广告话术)也经历了以下多种过滤方法:
第一、敏感词替换
敏感词替换是较早出现的一种敏感词过滤方式,即系统不会在用户端进行敏感词过滤和校验,而是把这个工作放在数据入库之前完成,在数据写入数据库之前,系统根据已经制定的规则把所有敏感词替换为设定好的符号或文字,这个过程是不可逆的。
这种技术手段对于阻止网络暴力成效显著,用户在阅读其他人的发布信息时,不会再看到那些刺眼的侮辱性的字眼,但又不会太过于破坏发布者的本意。同时,它不会对用户的阅读造成很大的干扰和障碍,尤其是在聊天室或群组等场景中。