正则表达式

正则表达式是一串特定字符,组成一个“规则字符串”,这个“规则字符串”是描述文本规则的工具,正则表达式就是记录文本规则的代码。
规则定义:

[]              :默认表示一个字符
[abc]           :表示a、b、c中任意一个字符
[^abc]          :除了a、b、c的任意一个字符
[a-z]           :表示a到z中的任意一个字符
[a-zA-Z0-9_]    :表示a到z、A到Z、0到9以及下滑线中的任意一个字符
**[a-z&&[^bc]]  :表示a到z中除了b、c之外的任意一个字符,&&表示“与”的关系
.              :表示任意一个字符
|               :或
\               :转义 
,              :分割
\d              :任意一个数字字符,**等价于[0-9]**
\D              :任意一个非数字字符,**等价于[^0-9]**
\s              :空白字符,**等价于[\t\n\f\r\x0B]**
\S              :非空白字符,**等价于[^\s]**
\w              :任意一个单词字符,**等价于[a-zA-Z0-9_]**
\W              :任意一个非单词字符,**等价于[^\w]**
^               :表示字符串必须以他后面约束的内容开始**(作为开始)**
$               :表示字符串必须以他前面约束的内容结尾**(作为结束)**
?               :表示前面的内容出现**0到1次(重复0次或1次)**
*               :表示前面的内容出现**0到多次(重复任意次)**
+               :表示前面的内容出现**1到多次(重复>=1次)**
{n}             :表示前面的字符**重复n次**
{n,}            :表示前面的字符**至少重复n次(重复>=n次)**
{n,m}           :表示前面的字符 **至少重复n次,并且小于m次( 重复>=n次 && 重复小于m次)**

等价关系:
?,*,+,\d,\w 都是等价字符
?等价于匹配长度{0,1}
*等价于匹配长度{0,}
+等价于匹配长度{1,}
\d等价于[0-9]
\w等价于[A-Za-z_0-9]。

常用的正则表达式:

1. 验证用户名和密码:("^[a-zA-Z]\w{5,15}$")正确格式:"[A-Z][a-z]_[0-9]"组成,并且第一个字必须为字母6~16位;
2. 验证电话号码:("^(\\d{3,4}-)\\d{7,8}$")正确格式:xxx/xxxx-xxxxxxx/xxxxxxxx;
3. 验证手机号码:"^1[3|4|5|7|8][0-9]\\d{8}$";
4. 验证身份证号(15位或18位数字):"\\d{14}[[0-9],0-9xX]";
5. 验证Email地址:("^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$");
6. 只能输入由数字和26个英文字母组成的字符串:("^[A-Za-z0-9]+$") ;
7. 整数或者小数:^[0-9]+([.][0-9]+){0,1}$
8. 只能输入数字:"^[0-9]*$"。
9. 只能输入n位的数字:"^\d{n}$"。
10. 只能输入至少n位的数字:"^\d{n,}$"。
11. 只能输入m~n位的数字:"^\d{m,n}$"。
12. 只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。
13. 只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"。
14. 只能输入有1~3位小数的正实数:"^[0-9]+(\.[0-9]{1,3})?$"。
15. 只能输入非零的正整数:"^\+?[1-9][0-9]*$"。
16. 只能输入非零的负整数:"^\-[1-9][0-9]*$"。
17. 只能输入长度为3的字符:"^.{3}$"。
18. 只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。
19. 只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。
20. 只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。
21. 验证是否含有^%&',;=?$\"等字符:"[%&',;=?$\\^]+"。
22. 只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"。
23. 验证URL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"。
24. 验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01"~"09"和"10"~"12"。
25. 验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式
    为;"01"~"09"、"10"~"29"和“30”~“31”。
26. 获取日期正则表达式:\\d{4}[年|\-|\.]\d{\1-\12}[月|\-|\.]\d{\1-\31}日?
    评注:可用来匹配大多数年月日信息。
27. 匹配双字节字符(包括汉字在内):[^\x00-\xff]
    评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
28. 匹配空白行的正则表达式:\n\s*\r
    评注:可以用来删除空白行
29. 匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? />
    评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
30. 匹配首尾空白字符的正则表达式:^\s*|\s*$
    评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
31. 匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
    评注:网上流传的版本功能很有限,上面这个基本可以满足需求
32. 匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
    评注:表单验证时很实用
33. 匹配腾讯QQ号:[1-9][0-9]{4,}
    评注:腾讯QQ号从10 000 开始
34. 匹配中国邮政编码:[1-9]\\d{5}(?!\d)
    评注:中国邮政编码为6位数字
35. 匹配ip地址:([1-9]{1,3}\.){3}[1-9]。
    评注:提取ip地址时有用
36. 匹配MAC地址:([A-Fa-f0-9]{2}\:){5}[A-Fa-f0-9]
    Function IsRegu(Regu,s)

java测试对应字符串的正则表达式的类和方法
Pattern的作用是描述正则表达式的格式支持,使用静态方法compile注册正则表达式,生成实例。

String regStr="^[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.com|\\.cn|\\.net)+$";//定义邮箱正则表达式
Pattern pattern=Pattern.compile(regStr);//注册正则表达式
String mailStr="chang_2013@chang.com.cn";//自己的邮箱格式
//匹配字符串,返回描述匹配结果的Matcher实例
Matcher matcher=pattern.matcher(mailStr);
//通过调用Matcher的find方法得知是否匹配成功
if(matcher.find()){ 
    System.out.println("邮箱匹配成功!");      
}else{  
    System.out.println("邮箱格式错误!");          
}

注:在这里用到的两个类是Pattern (java.util.regex.Pattern)和Matcher (java.util.regex.Matcher)

javascript测试对应字符串的正则表达式的类和方法
1)方法:
①replace(regexp,”replacestr”):返回替换后的结果。
②match(regexp):返回匹配字符串的数组。
③search(regexp):得到匹配字符串的“首“字符位置的索引。
2)JavaScript中使用正则表达式:使用两个斜杠, / 表达式 / 匹配模式
①正则表达式回顾:\d 或者 [a-z]{3,5}。就是纯文本的表达式,用来表示某种匹配模式。在不同的语言环境下,提供了不同的类,执行或者使用正则表达式,实现文本的各种处理。
②匹配模式:g:global,全局匹配;m:multilin,多行匹配;i:忽略大小写匹配。

例如:var str1="abc123def";
var str2=str1.replace(/\d/g,"*");alert(str2);//abc***def,如果不用全局匹配则只替换一个数字
var array=str1.match(/\d/g);//1,2,3
var index=str1.search(/\d/);alert(index);//3

3)案例

eg1:查找并替换文本框中录入的子字符串 js 为 *
<input type="text" id="txtString" />
<input type="button" value="过滤特殊字符(js)" onclick="searchStringAndReplace();" />
function searchStringAndReplace() { 
    var str = document.getElementById("txtString").value;
    var count = 0;      
    var index = str.indexOf("js", 0);
    while (index > -1) {    
         str = str.replace("js","*"); 
         index = str.indexOf("js", index + 1);    
    }
    document.getElementById("txtString").value = str;                      
}
eg2:字符查询与过滤(使用正则表达式)
<input type="text" id="txtString" /><br />
<input type="button" value="查找字符并过滤" onclick="stringByRegex();" />
function stringByRegex() {  
    var str = document.getElementById("txtString").value;
    var result = str.match(/js/gi);
    document.getElementById("txtString").value = str.replace(/js/gi, "*");
    alert("共替换了" + result.length + "处。");                               
}

注意事项:
(1)邮箱格式的正则表达式 @无特殊含义,可直接写,也可[@]
(2)使用Java字符串去描述正则表达式的时候,会出现一个冲突,即如何正确描述正则表达式的“.”。
起因:在正则表达式中我们想描述一个“.”,但“.”在正则表达式中有特殊含义,他代表任意字符,所以我们在正则表达式中想描述“.”的愿义就要写成“\.”但是我们用java字符串去描述正则表达式的时候,因为“.”在java字符串中没有特殊意义,所以java认为我们书写String s=”\.”;是有语法错误的,因为“.”不需要转义,这就产生了冲突。
处理:我们实际的目的很简单,就是要让java的字符串描述”\.”又因为在java中”\”是有特殊含义的,代表转义字符我们只需要将”\”转义为单纯的斜杠,即可描述”\.”了所以我们用java描述“\.”的正确写法是String s=”\.”;
(3)若正则表达式不书写^或$,正则表达式代表匹配部分内容,都加上则表示权匹配

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值