正则表达式是一串特定字符,组成一个“规则字符串”,这个“规则字符串”是描述文本规则的工具,正则表达式就是记录文本规则的代码。
规则定义:
[] :默认表示一个字符
[abc] :表示a、b、c中任意一个字符
[^abc] :除了a、b、c的任意一个字符
[a-z] :表示a到z中的任意一个字符
[a-zA-Z0-9_] :表示a到z、A到Z、0到9以及下滑线中的任意一个字符
**[a-z&&[^bc]] :表示a到z中除了b、c之外的任意一个字符,&&表示“与”的关系
. :表示任意一个字符
| :或
\ :转义
, :分割
\d :任意一个数字字符,**等价于[0-9]**
\D :任意一个非数字字符,**等价于[^0-9]**
\s :空白字符,**等价于[\t\n\f\r\x0B]**
\S :非空白字符,**等价于[^\s]**
\w :任意一个单词字符,**等价于[a-zA-Z0-9_]**
\W :任意一个非单词字符,**等价于[^\w]**
^ :表示字符串必须以他后面约束的内容开始**(作为开始)**
$ :表示字符串必须以他前面约束的内容结尾**(作为结束)**
? :表示前面的内容出现**0到1次(重复0次或1次)**
* :表示前面的内容出现**0到多次(重复任意次)**
+ :表示前面的内容出现**1到多次(重复>=1次)**
{n} :表示前面的字符**重复n次**
{n,} :表示前面的字符**至少重复n次(重复>=n次)**
{n,m} :表示前面的字符 **至少重复n次,并且小于m次( 重复>=n次 && 重复小于m次)**
等价关系:
?,*,+,\d,\w 都是等价字符
?等价于匹配长度{0,1}
*等价于匹配长度{0,}
+等价于匹配长度{1,}
\d等价于[0-9]
\w等价于[A-Za-z_0-9]。
常用的正则表达式:
1. 验证用户名和密码:("^[a-zA-Z]\w{5,15}$")正确格式:"[A-Z][a-z]_[0-9]"组成,并且第一个字必须为字母6~16位;
2. 验证电话号码:("^(\\d{3,4}-)\\d{7,8}$")正确格式:xxx/xxxx-xxxxxxx/xxxxxxxx;
3. 验证手机号码:"^1[3|4|5|7|8][0-9]\\d{8}$";
4. 验证身份证号(15位或18位数字):"\\d{14}[[0-9],0-9xX]";
5. 验证Email地址:("^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$");
6. 只能输入由数字和26个英文字母组成的字符串:("^[A-Za-z0-9]+$") ;
7. 整数或者小数:^[0-9]+([.][0-9]+){0,1}$
8. 只能输入数字:"^[0-9]*$"。
9. 只能输入n位的数字:"^\d{n}$"。
10. 只能输入至少n位的数字:"^\d{n,}$"。
11. 只能输入m~n位的数字:"^\d{m,n}$"。
12. 只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。
13. 只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"。
14. 只能输入有1~3位小数的正实数:"^[0-9]+(\.[0-9]{1,3})?$"。
15. 只能输入非零的正整数:"^\+?[1-9][0-9]*$"。
16. 只能输入非零的负整数:"^\-[1-9][0-9]*$"。
17. 只能输入长度为3的字符:"^.{3}$"。
18. 只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。
19. 只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。
20. 只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。
21. 验证是否含有^%&',;=?$\"等字符:"[%&',;=?$\\^]+"。
22. 只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"。
23. 验证URL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"。
24. 验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01"~"09"和"10"~"12"。
25. 验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式
为;"01"~"09"、"10"~"29"和“30”~“31”。
26. 获取日期正则表达式:\\d{4}[年|\-|\.]\d{\1-\12}[月|\-|\.]\d{\1-\31}日?
评注:可用来匹配大多数年月日信息。
27. 匹配双字节字符(包括汉字在内):[^\x00-\xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
28. 匹配空白行的正则表达式:\n\s*\r
评注:可以用来删除空白行
29. 匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
30. 匹配首尾空白字符的正则表达式:^\s*|\s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
31. 匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
32. 匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用
33. 匹配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10 000 开始
34. 匹配中国邮政编码:[1-9]\\d{5}(?!\d)
评注:中国邮政编码为6位数字
35. 匹配ip地址:([1-9]{1,3}\.){3}[1-9]。
评注:提取ip地址时有用
36. 匹配MAC地址:([A-Fa-f0-9]{2}\:){5}[A-Fa-f0-9]
Function IsRegu(Regu,s)
java测试对应字符串的正则表达式的类和方法:
Pattern的作用是描述正则表达式的格式支持,使用静态方法compile注册正则表达式,生成实例。
String regStr="^[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.com|\\.cn|\\.net)+$";//定义邮箱正则表达式
Pattern pattern=Pattern.compile(regStr);//注册正则表达式
String mailStr="chang_2013@chang.com.cn";//自己的邮箱格式
//匹配字符串,返回描述匹配结果的Matcher实例
Matcher matcher=pattern.matcher(mailStr);
//通过调用Matcher的find方法得知是否匹配成功
if(matcher.find()){
System.out.println("邮箱匹配成功!");
}else{
System.out.println("邮箱格式错误!");
}
注:在这里用到的两个类是Pattern (java.util.regex.Pattern)和Matcher (java.util.regex.Matcher)
javascript测试对应字符串的正则表达式的类和方法:
1)方法:
①replace(regexp,”replacestr”):返回替换后的结果。
②match(regexp):返回匹配字符串的数组。
③search(regexp):得到匹配字符串的“首“字符位置的索引。
2)JavaScript中使用正则表达式:使用两个斜杠, / 表达式 / 匹配模式
①正则表达式回顾:\d 或者 [a-z]{3,5}。就是纯文本的表达式,用来表示某种匹配模式。在不同的语言环境下,提供了不同的类,执行或者使用正则表达式,实现文本的各种处理。
②匹配模式:g:global,全局匹配;m:multilin,多行匹配;i:忽略大小写匹配。
例如:var str1="abc123def";
var str2=str1.replace(/\d/g,"*");alert(str2);//abc***def,如果不用全局匹配则只替换一个数字
var array=str1.match(/\d/g);//1,2,3
var index=str1.search(/\d/);alert(index);//3
3)案例
eg1:查找并替换文本框中录入的子字符串 js 为 *
<input type="text" id="txtString" />
<input type="button" value="过滤特殊字符(js)" onclick="searchStringAndReplace();" />
function searchStringAndReplace() {
var str = document.getElementById("txtString").value;
var count = 0;
var index = str.indexOf("js", 0);
while (index > -1) {
str = str.replace("js","*");
index = str.indexOf("js", index + 1);
}
document.getElementById("txtString").value = str;
}
eg2:字符查询与过滤(使用正则表达式)
<input type="text" id="txtString" /><br />
<input type="button" value="查找字符并过滤" onclick="stringByRegex();" />
function stringByRegex() {
var str = document.getElementById("txtString").value;
var result = str.match(/js/gi);
document.getElementById("txtString").value = str.replace(/js/gi, "*");
alert("共替换了" + result.length + "处。");
}
注意事项:
(1)邮箱格式的正则表达式 @无特殊含义,可直接写,也可[@]
(2)使用Java字符串去描述正则表达式的时候,会出现一个冲突,即如何正确描述正则表达式的“.”。
起因:在正则表达式中我们想描述一个“.”,但“.”在正则表达式中有特殊含义,他代表任意字符,所以我们在正则表达式中想描述“.”的愿义就要写成“\.”但是我们用java字符串去描述正则表达式的时候,因为“.”在java字符串中没有特殊意义,所以java认为我们书写String s=”\.”;是有语法错误的,因为“.”不需要转义,这就产生了冲突。
处理:我们实际的目的很简单,就是要让java的字符串描述”\.”又因为在java中”\”是有特殊含义的,代表转义字符我们只需要将”\”转义为单纯的斜杠,即可描述”\.”了所以我们用java描述“\.”的正确写法是String s=”\.”;
(3)若正则表达式不书写^或$,正则表达式代表匹配部分内容,都加上则表示权匹配