开发一个模块,对敏感词进行过滤,把用户输入字符串里的敏感词替换成”*”. 如用户输入“我要发敏感字言论”替换成“我要发***言论”
开发要求:
1) 模块初始化,从mysql表里加载5000个敏感词(每个词有1~20个字),放到ETS里;
2) 提供函数,输入字符串(字数140字以内),输出替换后的字符串;
3) 不能只用穷举遍历进行替换,必须有一定的性能考虑;
4) ETS的敏感词表能进行热重载(不关闭程序情况下,重新从数据库加载);
5) 过滤干扰字符,如“我要发敏0感0字言论”能替换成“我要发*0*0*言论”;
反馈要求:
1.mysql表导出的SQL文件;
2.Erlang代码;
3.编译说明,使用说明,设计要点说明;
解题思路:
1,首关键字检索,
(1),建立敏感词库ETS,
(2),将首写字母相同的敏感词编成一组。
(3),中英文敏感词分开储存,
2,敏感词替换算法(首写字母检索匹配)
步骤:,foreach ETS表格,获取敏感词第一个字母的unicode值,
检索输入内容,通过sea