正则表达式 : / /
1.1正则表达式的字符类
[^...] 否定,例如:[^abc]匹配除abc之外的所有字符
[...] 方括号内的任意字符 *例如*[abc]和a b c中任意字符匹配的所有字符。
. 除换行符合其他Unicode行终止符之外的任意字符
\w 任何ASCII字符组成的单词,等价于[a-zA-Z0-9]
\W 任何不适ASCII字符组成的单词,等价于[^a-zA-Z0-9]
\s 任何Unicode空白符
\S 任何非Unicode空白字符的字符,注意\w和\S不同
\d 任何ASCII数组,等价与[0-9]
\D 除了ASCII数字之外的任何字符,等价于[^0-9]
[\b] 退格直接量
1.2正则表达式的重复字符语法
{n,m} 匹配前一项至少n次,但不能超过m次
{n,} 匹配前一项n次或者更多次
{n} 匹配前一项
? 匹配前一项0次或者1次,也就是说前一项是可选的,等价于{0,1}
+ 匹配前一项1次或多次,等价于{1,}
* 匹配前一项0次或多次,等价于{0,}
1.3正则表达式的选择、分组和引用字符
| 选择,匹配的是该符号左边的子表达式或右边的子表达式
(...) 组合,将几个项组合为一个单元,这个单元可通过“*”、“+”、“+”、和“|”等符号加以修饰,而且可以记住和这个组合相匹配的字符串以供伺候的引用使用
(?....)只组合,把项组合到一个单元,但不记忆与该组相匹配的字符
\n 和第n个分组第一次匹配的字符项匹配,组是圆括号中的子表达式(也有可能是嵌套的),组索引是从左到右的左括号数,“(?:”形式的分组不编码
1.4正则表达式中的锚字符
^ 匹配字符串的开头,在多行检索中,匹配一行的开头
$ 匹配字符串的结尾,在多行检索中,匹配一行的结尾
\b 匹配一个单词的边界,简言之,就会位于字符\w和字符\W之间的位置,或位于字符\w和字符串的开头或者结尾之间的位置(但需要注意,[\b]匹配的退格符)
\B 匹配非单词边界的位置
(?=p) 零宽正向先行断言,要求接下来的字符斗鱼p匹配,但不能包括匹配p的那些字符
(?|p)零宽负向先行断言,要求接下来的字符不予p匹配。
1.5正则表达式修饰符
i 执行不区分大小写的匹配
g 执行一个全局匹配,简言之,就是找到所有的匹配,而不是在找到第一个之后就停止
m 多行匹配模式,^匹配一行的开头和字符串的开头,$匹配行的结束和字符串的结束
1.6用于模式匹配的String方法
search() 参数:一个正则表达式,返回值:第一个与之匹配的子串的起始位置,找不到返回-1;不支持全局检索
replace() 检索与替换,参数1:一个正则表达式,参数2:要进行替换的字符串;
match() 参数:一个正则表达式,返回值:一个有匹配结果组成的数组,支持g
1.7RegExp对象与方法
exec() 对指定的字符串执行一个正则表达式,即为在一个字符串中执行匹配检索,返回数完整的数组组,与match不同的是,具有lastIndex属性。
test() 用test()对某个字符串进行检测。
1.8正则表达式的实例
/s$/ 以s结尾的所有字符串
/\d{2,4}/ 匹配2-4个数字
/\w{3}\d?/精确匹配三个单词和一个可选的数字
/\s+java\s+/ 匹配前后带有一个或多个空格的字符串"java"
/[^(]*/ 匹配一个或多个非左括号的字符
/ab|cd|ef/
/\d{3}|[a-z]{4}/ 匹配的是三位数字或者四个小写字母
*注意:如果发现了左边的选择项匹配,就忽略右边的匹配项,即使它产生更好的匹配* 例如:/a|ab/
圆括号:
1 把单独的项组合成子表达式 /java(script)?/ 可以匹配字符串"java",其后可以有"script"也可以没有。
2 在完整的模式中定义子模式。
3 允许在同一个正则表达式的后部引用前面的子表达式。