高效Java敏感词、关键词过滤工具包_过滤非法词句

原创 2011年04月03日 12:18:00

使用说明:
1、本工具包由北京师范大学计算机系 张人杰 开发制作 基于多叉树的查找,任何问题请联系:
alex.zhangrj@hotmail.com
2、工具包自带敏感词词库,第一次调用时读入词库,故第一次调用时间可能较长,在类加载后普通pc机上html过滤5000字在80毫秒左右,纯文本35毫秒左右。
3、如需自定义词库,将jar包考入WEB-INF工程的lib目录,在WEB-INF/classes目录下建一个utf-8的words.dict文本文件,在该文件中以“关键字=级别”的方式写入,比如:
中国共产党=4
中国人民=1
0为级别最小,过滤后返回原字符串中出现的最高级别
调用方法:WordFilterUtil.filterHtml(str,'*');

 

 

下载地址:http://download.csdn.net/user/ranjio_z

Java实现敏感词过滤

敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。前段时间我一个朋友(马上毕业,接触编程不久)要我帮他看一个文字过滤的东西,它说检索效率非常慢。我把它程序拿过来...
  • chenssy
  • chenssy
  • 2014-05-25 15:42:03
  • 94014

关键词过滤(脏字过滤)Trie Tree(Hash)和FastCheck两种过滤方式java版本

在做关键词过滤的时候,搜索到yeerh
  • workwithwebis3w
  • workwithwebis3w
  • 2014-07-30 10:51:36
  • 4819

Java敏感词过滤、java关键词过滤工具包原理

摘要:基于多叉树查找的Java敏感词过滤、java关键词过滤工具包原理 本算法对纯文本匹配执行效率:5000字35毫秒...
  • ranjio_z
  • ranjio_z
  • 2011-05-08 11:22:00
  • 5339

高效Java敏感词过滤、关键词过滤工具包_2.0版本

  • 2017年07月20日 10:46
  • 24KB
  • 下载

java 关键字过滤

以下实现对关键字的过滤: 两个个文件words.properties和KeyFilter.java; 1、words.properties配置关键字的配置文件;内容如下: name1 ...
  • linfssay
  • linfssay
  • 2012-05-24 17:20:06
  • 2827

高效关键字过滤java源码

  • 2011年08月12日 13:27
  • 4KB
  • 下载

java敏感词过滤(词库+算法)高效率验证

需求:用户输入一段文字,验证是否包含敏感词,以及具体的是哪些敏感词,替换为*等....1.需要一个词库,我这里就是一个从github下载的一个txt文件。已转存到百度网盘,点击下载词库,提取码:tk3...
  • yqwang75457
  • yqwang75457
  • 2018-03-01 09:41:43
  • 101

Java 实现文章汉字关键词(违禁词)识别2.0

说明:2.0相对1.0的算法改进 首先1.0是用父子节点树来保存树的,一个父对应多个子节点,这就不可避免要使用List来保存子节点,由于List的大小有限制,在1.0的时候加载的数据小于10万条,...
  • xianhujianke
  • xianhujianke
  • 2016-03-29 16:54:56
  • 1437

Java实现非法关键词过滤

功能说明:    对用户输入的参数进行过滤,并用*进行参数替换。1.Filter(过滤器)的使用    创建类KeyWordFilter(实现Filter),只需要实现其中的doFilter方法即可,...
  • a3025056
  • a3025056
  • 2018-03-01 16:08:15
  • 96
收藏助手
不良信息举报
您举报文章:高效Java敏感词、关键词过滤工具包_过滤非法词句
举报原因:
原因补充:

(最多只允许输入30个字)