正则表达式和敏感词汇过滤
1. 正则表达式
1.1 正则表达式
正则表达式是描述字符模式的对象。
正则表达式用于对字符串模式匹配及检索替换,是对字符串执行模式匹配的强大工具。
语法:
- var patt=new RegExp(pattern,modifiers);
- var patt=/pattern/modifiers;
var re = new RegExp("\\w+");
var re = /\w+/;
修饰符:用于执行区分大小写和全局匹配:
修饰符 | 描述 |
---|---|
i | 执行对大小写不敏感的匹配。 |
g | 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。 |
m | 执行多行匹配。 |
方括号:用于查找某个范围内的字符
表达式 | 描述 |
---|---|
[abc] | 查找方括号之间的任何字符。 |
[^abc] | 查找任何不在方括号之间的字符。 |
[0-9] | 查找任何从 0 至 9 的数字。 |
[a-z] | 查找任何从小写 a 到小写 z 的字符。 |
[A-Z] | 查找任何从大写 A 到大写 Z 的字符。 |
[A-z] | 查找任何从大写 A 到小写 z 的字符。 |
[adgk] | 查找给定集合内的任何字符。 |
[^adgk] | 查找给定集合外的任何字符。 |
(red|blue|green) | 查找任何指定的选项。 |
元字符(Metacharacter):是拥有特殊含义的字符:
元字符 | 描述 |
---|---|
. | 查找单个字符,除了换行和行结束符。 |
\w | 查找单词字符。 |
\W | 查找非单词字符。 |
\d | 查找数字。 |
\D | 查找非数字字符。 |
\s | 查找空白字符。 |
\S | 查找非空白字符。 |
\b | 匹配单词边界。 |
\B | 匹配非单词边界。 |
\0 | 查找 NULL 字符。 |
\n | 查找换行符。 |
\f | 查找换页符。 |
\r | 查找回车符。 |
\t | 查找制表符。 |
\v | 查找垂直制表符。 |
\xxx | 查找以八进制数 xxx 规定的字符。 |
\xdd | 查找以十六进制数 dd 规定的字符。 |
\uxxxx | 查找以十六进制数 xxxx 规定的 Unicode 字符。 |
量词:用于表示重复次数的含义
量词 | 描述 |
---|---|
n+ | 匹配任何包含至少一个 n 的字符串。例如,/a+/ 匹配 “candy” 中的 “a”,“caaaaaaandy” 中所有的 “a”。 |
n* | 匹配任何包含零个或多个 n 的字符串。例如,/bo*/ 匹配 “A ghost booooed” 中的 “boooo”,“A bird warbled” 中的 “b”,但是不匹配 “A goat grunted”。 |
n? | 匹配任何包含零个或一个 n 的字符串。例如,/e?le?/ 匹配 “angel” 中的 “el”,“angle” 中的 “le”。 |
n{X} | 匹配包含 X 个 n 的序列的字符串。例如,/a{2}/ 不匹配 “candy,” 中的 “a”,但是匹配 “caandy,” 中的两个 “a”,且匹配 “caaandy.” 中的前两个 “a”。 |
n{X,} | X 是一个正整数。前面的模式 n 连续出现至少 X 次时匹配。例如,/a{2,}/ 不匹配 “candy” 中的 “a”,但是匹配 “caandy” 和 “caaaaaaandy.” 中所有的 “a”。 |
n{X,Y} | X 和 Y 为正整数。前面的模式 n 连续出现至少 X 次,至多 Y 次时匹配。例如,/a{1,3}/ 不匹配 “cndy”,匹配 “candy,” 中的 “a”,“caandy,” 中的两个 “a”,匹配 “caaaaaaandy” 中的前面三个 “a”。注意,当匹配 “caaaaaaandy” 时,即使原始字符串拥有更多的 “a”,匹配项也是 “aaa”。 |
n{X} | 前面的模式 n 连续出现X 次时匹配 |
n$ | 匹配任何结尾为 n 的字符串。 |
^n | 匹配任何开头为 n 的字符串。 |
?=n | 匹配任何其后紧接指定字符串 n 的字符串。 |
?!n | 匹配任何其后没有紧接指定字符串 n 的字符串。 |
RegExp 对象方法
方法 | 描述 |
---|---|
compile | 编译正则表达式。 |
exec | 检索字符串中指定的值。返回找到的值,并确定其位置。 |
test | 检索字符串中指定的值。返回 true 或 false。 |
支持正则表达式的 String 对象的方法
方法 | 描述 |
---|---|
search | 检索与正则表达式相匹配的值。 |
match | 找到一个或多个正则表达式的匹配。 |
replace | 替换与正则表达式匹配的子串。 |
split | 把字符串分割为字符串数组。 |
正则表达式的使用
- test方法:搜索字符串指定的值,根据结果并返回真或假
- exec() 方法:检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回 null。
var patt1=new RegExp("e");
document.write(patt1.test("The best things in life are free"));
var patt1=new RegExp("e");
document.write(patt1.exec("The best things in life are free"));
1.2 常用正则表达式
用户名限制
^[a-zA-Z]\w{5,17}$
弱密码限制
^[a-zA-Z]\w{5,17}$
强密码限制
^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{6,18}$
^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,16}$
Email限制
^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
手机号
/^1[3-9]\d{9}$/
不会就百度
最新XXXXX正则
1.3 使用
var str = "18611110001";
// 正则表达式对象
var regExp = new RegExp(/^1[3-9]\d{9}$/);
var b = regExp.test(str);
console.log("手机号是否正确:" + b);
var email = "123@123.net.cn";
regExp = new RegExp(/^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/);
console.log("Email是否正确:" + regExp.test(email));
var userName = "gh_pfsp";
regExp = new RegExp(/^[a-zA-Z]\w{5,17}$/);
console.log("用户号是否合法:" + regExp.test(userName));
var password = "Liu12_4567.m";
regExp = new RegExp(/^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{6,18}$/);
console.log("密码是否合法:" + regExp.test(password));
2. 敏感词汇过滤
2.1 需求分析
数据从用户到服务器,需要保存或者展示,这里需要对一些敏感词汇进行过滤操作。如果说是用户提交到服务器之后,服务器来完成对应操作。通过Servlet来完成。对于Servlet来说,功能压力过多,且需要考虑的地方过多。
过滤器可以来满足对应的要求。
过滤器需要放行数据之前,对于用户提供的参数数据进行过滤,替换操作。
用户请求的request对象中,没有setParameter方法。
后台获取数据的相关方法:
String getParameter()
String[] getParameterValues()
Map<String, String[]> getParameterMap()
目标将所有相关方法的返回值进行获取和修改,再次返回放行。
代理!!!
2.2 生活中的代理
代理,代购,代办,代驾,代练
好想你 总代
1. 签协议
制定各种各样的规范,
【遵从】
Java中制定规范 ==> interface
2. 培训
已经存在的条例条款必须学会。
【继承】
Java中的继承 ==> class
3. 代理是真的厂方
【假】代理对象
Java中的代理类似操作过程
1. 创建代理对象
a. 真对象
b. 要求继承/使用的类
c. 要求遵从/使用的接口
2. 代理对象实现/增强方法
a. 得到方法的名字
b. 得到方法的参数
参数增强
通过【真实对象】执行对应方法,可以得到返回值或者一定的结果。
返回值增强