【java初学】正则表达式和敏感词汇过滤

正则表达式和敏感词汇过滤

1. 正则表达式
1.1 正则表达式
  • 正则表达式是描述字符模式的对象。

  • 正则表达式用于对字符串模式匹配及检索替换,是对字符串执行模式匹配的强大工具。

  • 语法:

    • var patt=new RegExp(pattern,modifiers);
    • var patt=/pattern/modifiers;
var re = new RegExp("\\w+");
var re = /\w+/;

修饰符:用于执行区分大小写和全局匹配:

修饰符描述
i执行对大小写不敏感的匹配。
g执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。
m执行多行匹配。

方括号:用于查找某个范围内的字符

表达式描述
[abc]查找方括号之间的任何字符。
[^abc]查找任何不在方括号之间的字符。
[0-9]查找任何从 0 至 9 的数字。
[a-z]查找任何从小写 a 到小写 z 的字符。
[A-Z]查找任何从大写 A 到大写 Z 的字符。
[A-z]查找任何从大写 A 到小写 z 的字符。
[adgk]查找给定集合内的任何字符。
[^adgk]查找给定集合外的任何字符。
(red|blue|green)查找任何指定的选项。

元字符(Metacharacter):是拥有特殊含义的字符:

元字符描述
.查找单个字符,除了换行和行结束符。
\w查找单词字符。
\W查找非单词字符。
\d查找数字。
\D查找非数字字符。
\s查找空白字符。
\S查找非空白字符。
\b匹配单词边界。
\B匹配非单词边界。
\0查找 NULL 字符。
\n查找换行符。
\f查找换页符。
\r查找回车符。
\t查找制表符。
\v查找垂直制表符。
\xxx查找以八进制数 xxx 规定的字符。
\xdd查找以十六进制数 dd 规定的字符。
\uxxxx查找以十六进制数 xxxx 规定的 Unicode 字符。

量词:用于表示重复次数的含义

量词描述
n+匹配任何包含至少一个 n 的字符串。例如,/a+/ 匹配 “candy” 中的 “a”,“caaaaaaandy” 中所有的 “a”。
n*匹配任何包含零个或多个 n 的字符串。例如,/bo*/ 匹配 “A ghost booooed” 中的 “boooo”,“A bird warbled” 中的 “b”,但是不匹配 “A goat grunted”。
n?匹配任何包含零个或一个 n 的字符串。例如,/e?le?/ 匹配 “angel” 中的 “el”,“angle” 中的 “le”。
n{X}匹配包含 X 个 n 的序列的字符串。例如,/a{2}/ 不匹配 “candy,” 中的 “a”,但是匹配 “caandy,” 中的两个 “a”,且匹配 “caaandy.” 中的前两个 “a”。
n{X,}X 是一个正整数。前面的模式 n 连续出现至少 X 次时匹配。例如,/a{2,}/ 不匹配 “candy” 中的 “a”,但是匹配 “caandy” 和 “caaaaaaandy.” 中所有的 “a”。
n{X,Y}X 和 Y 为正整数。前面的模式 n 连续出现至少 X 次,至多 Y 次时匹配。例如,/a{1,3}/ 不匹配 “cndy”,匹配 “candy,” 中的 “a”,“caandy,” 中的两个 “a”,匹配 “caaaaaaandy” 中的前面三个 “a”。注意,当匹配 “caaaaaaandy” 时,即使原始字符串拥有更多的 “a”,匹配项也是 “aaa”。
n{X}前面的模式 n 连续出现X 次时匹配
n$匹配任何结尾为 n 的字符串。
^n匹配任何开头为 n 的字符串。
?=n匹配任何其后紧接指定字符串 n 的字符串。
?!n匹配任何其后没有紧接指定字符串 n 的字符串。

RegExp 对象方法

方法描述
compile编译正则表达式。
exec检索字符串中指定的值。返回找到的值,并确定其位置。
test检索字符串中指定的值。返回 true 或 false。

支持正则表达式的 String 对象的方法

方法描述
search检索与正则表达式相匹配的值。
match找到一个或多个正则表达式的匹配。
replace替换与正则表达式匹配的子串。
split把字符串分割为字符串数组。

正则表达式的使用

  • test方法:搜索字符串指定的值,根据结果并返回真或假
  • exec() 方法:检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回 null。
var patt1=new RegExp("e");
document.write(patt1.test("The best things in life are free"));
var patt1=new RegExp("e");
document.write(patt1.exec("The best things in life are free"));
1.2 常用正则表达式
用户名限制
	^[a-zA-Z]\w{5,17}$
弱密码限制
	^[a-zA-Z]\w{5,17}$
强密码限制
	^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{6,18}$
	^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,16}$
Email限制
	^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
手机号
	/^1[3-9]\d{9}$/

不会就百度
	最新XXXXX正则
1.3 使用
var str = "18611110001";
// 正则表达式对象
var regExp = new RegExp(/^1[3-9]\d{9}$/);
var b = regExp.test(str);
console.log("手机号是否正确:" + b);

var email = "123@123.net.cn";
regExp = new RegExp(/^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/);
console.log("Email是否正确:" + regExp.test(email));

var userName = "gh_pfsp";
regExp = new RegExp(/^[a-zA-Z]\w{5,17}$/);
console.log("用户号是否合法:" + regExp.test(userName));

var password = "Liu12_4567.m";
regExp = new RegExp(/^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{6,18}$/);
console.log("密码是否合法:" + regExp.test(password));
2. 敏感词汇过滤
2.1 需求分析
	数据从用户到服务器,需要保存或者展示,这里需要对一些敏感词汇进行过滤操作。如果说是用户提交到服务器之后,服务器来完成对应操作。通过Servlet来完成。对于Servlet来说,功能压力过多,且需要考虑的地方过多。
	过滤器可以来满足对应的要求。
	
	过滤器需要放行数据之前,对于用户提供的参数数据进行过滤,替换操作。
		用户请求的request对象中,没有setParameter方法。
	
	后台获取数据的相关方法:
		String getParameter()
        String[] getParameterValues()
        Map<String, String[]> getParameterMap()
        
    目标将所有相关方法的返回值进行获取和修改,再次返回放行。
    
    代理!!!
2.2 生活中的代理
代理,代购,代办,代驾,代练

 好想你 总代
	1. 签协议
		制定各种各样的规范,
		【遵从】 
		Java中制定规范 ==> interface
	2. 培训
		已经存在的条例条款必须学会。
		【继承】
		Java中的继承 ==> class
	3. 代理是真的厂方
		【假】代理对象

Java中的代理类似操作过程
	1. 创建代理对象
		a. 真对象
		b. 要求继承/使用的类
		c. 要求遵从/使用的接口
	2. 代理对象实现/增强方法
		a. 得到方法的名字
		b. 得到方法的参数
		
		参数增强
		通过【真实对象】执行对应方法,可以得到返回值或者一定的结果。
		返回值增强
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值