正则表达式的语法及使用
什么是正则表达式
正则表达式:是一种描述字符串结构的语法规则,是用于匹配字符串中字符组合的模式,同时正则表达式也是对象。
正则表达式的特点
正则表达式的灵活性。
逻辑性和功能性非常强。
可以迅速地用极简单的方式达到字符串的复杂控制。
正则表达式的使用
1、创建正则对象:
// 字面量方式
var 变量名 = /表达式/
// RegExp构造函数方式
var 变量名 = new RegExp(/表达式/)
2、test()方法来检测字符串是否符合正则规则。
正则对象.test(字符串) //匹配成功返回true,失败返回false
模式修饰符
i:将匹配设置为不区分大小写,搜索时不区分大小写: A 和 a 没有区别。
g:查找所有的匹配项。
m:使边界字符 ^ 和 $ 匹配每一行的开头和结尾,记住是多行,而不是整个字符串的开头和结尾。
s:默认情况下的圆点 . 是 匹配除换行符 \n 之外的任何字符,加上 s 修饰符之后, . 中包含换行符 \n。
边界符
边界符:正则表达式中的边界符(位置符)用来提示字符所处的位置。
^:表示匹配行首的文本。
$:表示匹配行尾的文本。
预定义类
.:匹配除“\n”外的任何单个字符。
\d:匹配所有0~9之间的任意一个数字,相当于[0-9]。
\D:匹配所有0~9以外的字符,相当于[^0-9]。
\w:匹配任意的字母、数字和下划线,相当于[a-zA-Z0-9]。
\W:除所有字母、数字和下划线以外的字符,相当于[^a-zA-Z0-9]。
\s:匹配空格(包括换行符、制表符、空格符等),相当于[\t\r\n\v\f]
\S:匹配非空格的字符,相当于[^\t\r\n\v\f]。
\f:匹配一个换页符(form-feed)。
\b:匹配单词分界符。如“\bg”可以匹配“best grade”,结果为“g”。
\B:非单词分界符。如“\Bade”可以匹配“best grade”,结果为“ade”。
\t:匹配一个水平制表符(tab)。
\n:匹配一个换行符(linefeed)。
\xhh:匹配ISO-8859-1值为hh(2个16进制数字)的字符,如“\x61”表示“a”。
\r:匹配一个回车符(carriage return)。
\v:匹配一个垂直制表符(vertical tab)。
\uhhhh:匹配Unicode 值为 hhhh (4个16进制数字)的字符,如“\u597d”表示“好”。
字符类
\t:匹配一个水平制表符(tab)。
\n:匹配一个换行符(linefeed)。
\xhh:匹配ISO-8859-1值为hh(2个16进制数字)的字符,如“\x61”表示“a”。
\r:匹配一个回车符(carriage return)。
\v:匹配一个垂直制表符(vertical tab)。
[cat]:匹配字符集合中的任意一个字符c、a、t。
[^cat]:匹配除c、a、t以外的字符。
[A-Z]:匹配字母A~Z范围内的字符。
[^a-z]:匹配字母a~z范围外的字符。
[a-zA-Z0-9]:匹配大小写字母和0~9范围内的字符。
[\u4e00-\u9fa5]:匹配任意一个中文字符。
量词符
?:匹配?前面的字符零次或一次。
+:匹配+前面的字符一次或多次。
*:匹配*前面的字符零次或多次。
{n}:匹配{}前面的字符n次。
{n,}:匹配{}前面的字符最少n次。
括号字符
1、改变限定符的范围。
正则表达式:catch|er
可匹配的结果:catch、er
正则表达式:catch|er
可匹配的结果:catch、er
2、分组:使用小括号可以进行分组,当小括号后面有量词符时,就表示对整个组进行操作。
正则表达式:abc{2}
可匹配的结果:abcc
正则表达式: a(bc){2}
可匹配的结果:abcbc
捕获与非捕获
1、捕获:使用小括号可以进行分组,当小括号后面有量词符时,就表示对整个组进行操作。
2、非捕获: (?:x)方式实现非捕获。
贪婪与懒惰匹配
贪婪与懒惰匹配:所谓贪婪表示匹配尽可能多的字符,而惰性表示匹配尽可能少的字符。
懒惰匹配:正则匹配默认是贪婪匹配,通过 “?”
符号实现惰性匹配。
var reg1 = /w.*b/gi; // 贪婪匹配
var reg2 = /w.*?b/gi; // 懒惰匹配
正则表达式优先级
正则表达式各种符号的优先级,由高到低排列。
String类中的方法
match()方法
match()方法:根据正则匹配出所有符合要求的内容匹配成功后将其保存到数组中,匹配失败则返回false。
search()方法
search()方法:search()方法可以返回指定模式的子串在字符串首次出现的位置,相对于indexOf()方法来说功能更强大。
split()方法
split()方法:split()方法用于根据指定的分隔符将一个字符串分割成字符串数组,其分割后的字符串数组中不包括分隔符。
replace()方法
replace()方法:replace()方法用于替换字符串,用来操作的参数可以是一个字符串或正则表达式。
常用的正则表达式
1、腾讯QQ号:[1-9][0-9]{4,}
(腾讯QQ号从10000开始)
2、中国邮政编码:[1-9]\d{5}(?!\d)
(中国邮政编码为6位数字)
3、IPv4地址:((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})(\.((2(5[0-5]|[0-4]\d))|[0-1]?\d{1,2})){3}
4、HTML标记的正则表达式:<(\S*?)[^>]*>.*?|<.*? />
( 首尾空白字符的正则表达式:^\s*|\s*$或(^\s*)|(\s*$)
(可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)
5、强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在 8-10 之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
6、强密码(必须包含大小写字母和数字的组合,可以使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
7、身份证号(15位、18位数字),最后一位是校验位,可能为数字或字符X:(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
8、电话号码正则表达式(支持手机号码,3-4位区号,7-8位直播号码,1-4位分机号): ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
9、帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10、Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$