[正则表达式]自己使用总结(大纲)

作者:zccst

感觉正则表达式就像一个妖怪,一会觉得难得不行了,一会又觉得没那么难,这种感觉交替出现很多次了。还有就是一开始觉得完全看不懂的正则在耐心看了一段时间后,竟然看懂了,然后一点也不觉得难了。


2014-04-23
[b][size=xx-large]一、基础[/size][/b]


[size=large][b]3,圆括号的几种含义[/b][/size]
除了改变优先级的基本概念外,圆括号还有分组的功能。


[size=large][b]2,贪婪/非模式,及对应的 ?: ?= ?!=[/b][/size]
贪婪:尽可能多的匹配
不贪婪:在遇到限定符*,+,?,{n},{n,},{n,m}时,例'o+?'匹配o,'o+'匹配所有
patten
?:patten industr(?:y|ies)
?=patten windows?=95|98|2000
?!=patten windows?!=95|98|2000


[size=large][b]1,常用各种语法[/b][/size]
(1)
直接量字符
\0 \t \n \v \f \r \b(匹配一个单词边界), \B(不匹配单词边界)
\NUM(匹配NUM个,如(.)\1匹配两个连续相同的字符), \oNUM(八进制), \xNUM(十六进制)

[color=red]元字符 ^, $ . : =[/color]

. 匹配除"\r\n"之外的任何单个字符。要匹配包括"\r\n"在内的任何字符,请使用像"[\s\S]"模式
/notFound.png$/.test("images/notFound.png");//true
/notFound\.png$/.test("images/notFound.png");//true
批注:如果想使用元字符,需要加反斜杠转义。


(2)字符
\s(匹配空白字符), \S(匹配非空白字符)
\w(匹配字母,数字或下划线字符), \W
\d(匹配一个数字,/\d/=/[0-9]/), \D(非数字,/\D/=/[^0-9]/)
[a-z]表示匹配字符集中任意一个,[^a-z]不匹配字符集中任意一个

[color=red](3)重复[/color]
*(0次或多次), +(1次或多次), ?(0次或1次)
例子:
/\s+java\s+/ 匹配前后带有一个或多个空格的字符串"java"
/[^(]*/ 匹配一个或多个左括号的字符

{n}匹配n次,{n,m} 表示匹配n到m次数,{n,}匹配n次以上
例子1:
/\d{2,4}/ 匹配2-4个数字
/\w{3}\d?/ 精确匹配三个单词和一个可选的数字

例子2:'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o。
例子3:\{([a-zA-Z_]{3,})\}
解析,
(1)先看括号内([a-zA-Z_]{3,})
[a-zA-Z_] 意思是匹配a-z、A-Z和下划线字符
{3,} 意思是上面的重复三次及以上,即连续三个字符及以上为符合条件
(2)在大括号内\{\}
如果不用转移,{}相当于出现次数,如果使用转移,则为大括号自身。


[b][size=xx-large]二、函数[/size][/b]

1,RegExp函数
exec
test

2,字符串函数
match
search
replace
split


[size=large][b]1,RegExp函数[/b][/size]

[b](1)exec[/b]
exec() 方法的功能非常强大,它是一个通用的方法,而且使用起来也比 test() 方法以及支持正则表达式的 String 对象的方法更为复杂。

如果 exec() 找到了匹配的文本,则返回一个结果数组。否则,返回 null。此数组的第 0 个元素是与正则表达式相匹配的文本,第 1 个元素是与 RegExpObject 的第 1 个子表达式相匹配的文本(如果有的话),第 2 个元素是与 RegExpObject 的第 2 个子表达式相匹配的文本(如果有的话),以此类推。除了数组元素和 length 属性之外,exec() 方法还返回两个属性。index 属性声明的是匹配文本的第一个字符的位置。input 属性则存放的是被检索的字符串 string。我们可以看得出,在调用非全局的 RegExp 对象的 exec() 方法时,返回的数组与调用方法 String.match() 返回的数组是相同的。



function execDemo(){
var r, re; // 声明变量。
var s = "The rain in Spain falls mainly in the plain mainly";
re = /[\w]*(ai)n(ly)/ig;
r = re.exec(s);//此结果只是匹配的第一个结果。不过里面还是一个数组
document.write(r + "<br/>");
console.log(r);
for(key in r){
document.write(key + "-" + r[key] + "<br/>");
console.log(key , "-" , r[key])
}
alert(r['lastIndex']);
}
execDemo();

r打印出来的结果是
[0] mainly
[1] ai
[2] ly
index 24
input The rain in Spain falls mainly in the plain mainly


返回所有匹配结果,可以使用while
while ((result = re.exec(s)) != null) {

}


[b](2)test[/b]
返回一个 Boolean 值,它指出在被查找的字符串中是否匹配给出的正则表达式。
rgexp.test(str)

例如:
var browser = {};
var ua = navigator.userAgent;
//是否为Gecko内核
browser.isGecko = /gecko/i.test(ua) && !/like gecko/i.test(ua);


[size=large][b]2,字符串函数[/b][/size]

[b](1)match[/b]
match() 方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。
该方法类似 indexOf() 和 lastIndexOf(),但是它返回指定的值,而不是字符串的位置。

var name = "JeffreyWay";
name.match(/e/); //e
name.match(/e/g); //e,e,还可以name.match(/e/g)[1]
var string = 'This is just a string with some 12345 and some !@#$ mixed in.';
alert(string.match(/[a-z]+/gi)); // alerts "This,is,just,a,string,with,some,and,some,mixed,in"


理由:可以匹配一个或多个大写或小写字母。i不区分大小写,g全局

如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置,input 属性声明的是对 stringObject 的引用。

如果 regexp 具有标志 g,则 match() 方法将执行全局检索,找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串,则返回 null。如果找到了一个或多个匹配子串,则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同,它的数组元素中存放的是 stringObject 中所有的匹配子串,而且也没有 index 属性或 input 属性。

注意:在全局检索模式下,match() 即不提供与子表达式匹配的文本的信息,也不声明每个匹配子串的位置。如果您需要这些全局检索的信息,可以使用 RegExp.exec()。


再例如:
"cid=100&from=webapp&uc_param_str=dncpeiwi".match(/(^|&)cid=([^&]*)(&|$)/)
结果是: ["cid=100&", "", "100", "&"]
分析要点:
(1)没有使用全局g,也就是只匹配一次。
(2)第一个圆括号(^|&)表示要么以cid=开头,要么以&cid=开头
(3)第二个圆括号([^&]*)表示cid=后面跟0个或多个除了&之外的任何字符
(4)第三个圆括号的意思([^&]*)要么后面跟&,要么直接结束。
再来看结果,是一个数组,四个值,表示匹配了四次
(1)数组的第一个元素是通篇下来匹配成功的文本 cid=100&,由于没有g,只匹配了一次
其余的元素存放的是与正则表达式的子表达式匹配的文本
(2)数组的第二个元素"",表示第一个圆括号的子匹配,结果是""(cid前为空)
(3)数组的第三个元素"",表示第二个圆括号的子匹配,结果是100
(4)数组的第四个元素"",表示第三个圆括号的子匹配,结果是&
结果是组的arr[2]是我们最终想要的结果,但是由于匹配了出&外的任意字符,使用前还需要unescape一下,unescape(arr[2]);
这样就是我们最终想要的结果了。

如果改成
"pi=1&id=200&from=sina&to=a".match(/(^|&)id=([^&]*)(&|$)/)
匹配结果是
["&id=200&", "&", "200", "&"]
第一个元素是第一个圆括号的子匹配,所以匹配到了&


[b](2)search[/b]


[b](3)replace[/b]
使用详见:[url]http://zccst.iteye.com/admin/blogs/1672814[/url]


[b](4)split[/b]
var str = 'this is my string';
alert(str.split(/\s/)); // alerts "this, is, my, string",可以str.split(/\s/)[3]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值