【敏感词过滤】Java 敏感词过滤

一、数据库数据处理

将不同长度的敏感词,放入map中,此map的key为词的长度,value的类型为Map<String, Object>,用于存放对应的敏感词,确保敏感词不会重复。
另将敏感词的第一个字放入指定map中,将其作为key存入,value则存入对应长度的二进制数据,其中1在第几位,就说明以这个key开头的敏感字的长度是多少,然后再到指定的map中进行搜索

private Map<Integer, Map<String, Object>> maps = null;
private Map<String, Integer> wins = null;

public Boolean blankWord(){
        List<JobSensitiveChar> list = this.list();
        if(list.size()>0 && ObjectUtil.isNotEmpty(list.get(0).getText())){
            String text = list.get(0).getText();
            List<String> strings = Arrays.asList(text.split(","));
            maps = new HashMap<Inte
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
以下是Java中利用DFA算法实现敏感词过滤的方法: 1.首先需要构建敏感词库,将所有敏感词存储在一个Trie树中。 2.然后需要实现DFA算法,对输入的文本进行扫描,查找其中是否包含敏感词。 3.在DFA算法中,需要定义一个状态转移表,用于记录当前状态和下一个状态之间的转移关系。状态转移表可以使用HashMap来实现。 4.对于每个输入字符,都需要根据状态转移表来进行状态转移。如果当前状态是敏感词的结尾状态,则说明找到了一个敏感词。 5.最后,将所有找到的敏感词替换成指定的字符即可。 以下是Java代码示例: ```java import java.util.HashMap; import java.util.Map; public class SensitiveWordFilter { private TrieNode root = new TrieNode(); private static final char REPLACE_CHAR = '*'; public SensitiveWordFilter(String[] words) { for (String word : words) { insertWord(word); } } private void insertWord(String word) { TrieNode node = root; for (char c : word.toCharArray()) { if (!node.children.containsKey(c)) { node.children.put(c, new TrieNode()); } node = node.children.get(c); } node.isEnd = true; } public String filter(String text) { StringBuilder sb = new StringBuilder(); int i = 0; while (i < text.length()) { TrieNode node = root; int j = i; while (j < text.length() && node.children.containsKey(text.charAt(j))) { node = node.children.get(text.charAt(j)); if (node.isEnd) { for (int k = i; k <= j; k++) { sb.append(REPLACE_CHAR); } i = j + 1; break; } j++; } if (j == text.length() || !node.children.containsKey(text.charAt(j))) { sb.append(text.charAt(i)); i++; } } return sb.toString(); } private static class TrieNode { Map<Character, TrieNode> children = new HashMap<>(); boolean isEnd = false; } } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值