Java查找敏感词

今天想要实现查找敏感词的功能,在网上找了之后,看到这篇博客Java实现敏感词过滤
把作者的源码跑了下,遇到了几个问题:

注:敏感词文件里的敏感词为(一个敏感词占一行):
这里写图片描述

在跑到addSensitiveWordToHashMap这个方法的时候,添加敏感词汇的Map第一个元素中没有key这里写图片描述
所以在查找的时候不能吧段落中含有的第一个敏感词找出来。找了下原因,是因为编码的问题

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
以下是一个Java代码示例来查找和替换敏感词: ```java import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; public class SensitiveWordFilter { private List<String> sensitiveWords = new ArrayList<>(); private static final String REPLACEMENT = "***"; public SensitiveWordFilter(List<String> sensitiveWords) { this.sensitiveWords = sensitiveWords; } public String filter(String text) { // 创建正则表达式 StringBuilder patternBuilder = new StringBuilder(); for (String word : sensitiveWords) { patternBuilder.append(word).append("|"); } patternBuilder.deleteCharAt(patternBuilder.length() - 1); String pattern = patternBuilder.toString(); // 匹配 Pattern regex = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE); Matcher matcher = regex.matcher(text); // 替换 String result = matcher.replaceAll(REPLACEMENT); return result; } } ``` 使用示例: ```java List<String> sensitiveWords = new ArrayList<>(); sensitiveWords.add("敏感词1"); sensitiveWords.add("敏感词2"); sensitiveWords.add("敏感词3"); SensitiveWordFilter filter = new SensitiveWordFilter(sensitiveWords); String text = "这是一段包含敏感词的文本:敏感词1,敏感词2,敏感词3。"; String result = filter.filter(text); System.out.println(result); // 输出:"这是一段包含敏感词的文本:***,***,***。" ``` 该代码创建了一个 `SensitiveWordFilter` 类,它接收一个敏感词列表并提供一个 `filter()` 方法来过滤文本中的敏感词。方法使用正则表达式和 Java 中的 `Matcher` 类来查找和替换敏感词。最后,它返回过滤后的文本。注意,在本例中,所有敏感词都被替换为相同的字符串“***”,但您可以根据需要自行更改替换字符串。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值