好了我们开始说正则表达式。正则表达式也称规则表达式(Regular Expression),是操作字符串的一种逻辑公式,就是用事先规定的一些字符以及这些特定字符的组合,组成一个”规则字符串“,这个规则字符串用来表达对字符串的一种匹配模式。
正则表达式对象
计算机中,可以根据正则表达式,来检查一个字符串是否符合规则,获得的字符串中符合规则的内容。
语法:var 变量 = new RegExp("正则表达式","匹配模式");
使用typeof检查正则对象,会返回object。在构造函数中可以传递一个匹配模式作为第二个参数,可以是:
i
忽略大小写。
g
全局匹配模式。
-
正则表达式的test()方法:
-
使用
test()
:test()
方法是一个正则表达式方法。test()
方法用于检测一个字符串是否匹配某个模式,如果字符串中含有匹配的文本,则返回 true,否则返回 false。以下实例用于搜索字符串中的字符 “e”:
var patt = new RegExp("e","i");
document.write(patt1.test("The best things in life are free"));//true
- 使用字面量来穿件正则表达式。语法:
var 变量 = /正则表达式/匹配模式
。
var patt1 = /a/i;
document.write(patt1.test("The best things in life are free"));//true
这个和上面的是一模一样的,这种方式创建正则表达式更加简单,但是使用构造函数创建更加灵活。
- 使用
|
表示或者的意思:var patt = /a|b/i;
判断是否有a或者b。 - 创建一个正则表达式检查一个字符串中是否含有字母。
[]
中的内容也是或的关系。[ab] == a|b
。reg = /[a-z]/
表示任意的小写字母。reg = /[A-z]/
表示任意字母。
- 检察一个字符串中是否含有abc或adc或aec。
reg = /abc|adc|aec/
。reg = /a[bde]c/
。
[^ ]
表示除了,reg = /[^a]/
检测字符串中是否没有a。reg = /[0-9]/
,表示数字。
正则表达式语法
量词
通过量词可以设置一个内容出现的次数。
创建一个正则表达式,检查一个字符串中是否含有aaa。
var reg = /a{3}/;
{n}
正好出现n次。量词只对前面的一个内容起作用。
创建一个正则表达式,检查一个字符串中是否含有ababab。
var reg = /(ab){3}/;
创建一个正则表达式,检查一个字符串是否含有b或bb或bbb(1到3个b)。
var reg = /b{1,3}/;
{m,n}
出现m-n次。{m, }
出现m次以上。
量词 | 描述 |
---|---|
n+ | 匹配任何包含至少一个 n 的字符串。例如,/a+/ 匹配 “candy” 中的 “a”,“caaaaaaandy” 中所有的 “a”。 |
n* | 匹配任何包含零个或多个 n 的字符串。例如,/bo*/ 匹配 “A ghost booooed” 中的 “boooo”,“A bird warbled” 中的 “b”,但是不匹配 “A goat grunted”。 |
n? | 匹配任何包含零个或一个 n 的字符串。例如,/e?le?/ 匹配 “angel” 中的 “el”,“angle” 中的 “le”。 |
n{X} | 匹配包含 X 个 n 的序列的字符串。例如,/a{2}/ 不匹配 “candy,” 中的 “a”,但是匹配 “caandy,” 中的两个 “a”,且匹配 “caaandy.” 中的前两个 “a”。 |
n{X,} | X 是一个正整数。前面的模式 n 连续出现至少 X 次时匹配。例如,/a{2,}/ 不匹配 “candy” 中的 “a”,但是匹配 “caandy” 和 “caaaaaaandy.” 中所有的 “a”。 |
n{X,Y} | X 和 Y 为正整数。前面的模式 n 连续出现至少 X 次,至多 Y 次时匹配。例如,/a{1,3}/ 不匹配 “cndy”,匹配 “candy,” 中的 “a”,“caandy,” 中的两个 “a”,匹配 “caaaaaaandy” 中的前面三个 “a”。注意,当匹配 “caaaaaaandy” 时,即使原始字符串拥有更多的 “a”,匹配项也是 “aaa”。 |
n$ | 匹配任何结尾为 n 的字符串。 |
^n | 匹配任何开头为 n 的字符串。 |
?=n | 匹配任何其后紧接指定字符串 n 的字符串。 |
?!n | 匹配任何其后没有紧接指定字符串 n 的字符串。 |
/^a&/
如果在一个正则表达式中同时使用^ &
则要求字符串必须完全符合正则表达式。
var reg = /^a&/;
console.log(reg.test("aaa"));//false
console.log(reg.test("a"));//true
如果想表示以a开头并且以a结尾,使用/^a|a$/
。
var reg = /^a|a&/;
console.log(reg.test("aaa"));//true
console.log(reg.test("a"));//true
创建一个正则表达式是否是一个合法的手机号:
手机号规则:
- 第一位以1开头。
- 第二位3-9任意数字。
- 第三位以后任意数字9个。
var phoneReg = /^1[3-9][0-9]{9}$/;
元字符
元字符(Metacharacter)是拥有特殊含义的字符:
元字符 | 描述 |
---|---|
. | 查找单个字符,除了换行和行结束符。 |
\w | 查找单词字符(任意字母、数字、下划线)相当于[A-z0-9]。 |
\W | 查找非单词字符(除了字母、数字、下划线)相当于[ ^A-z0-9]。 |
\d | 查找数字。相当于[0-9]。 |
\D | 查找非数字字符。相当于[ ^0-9]。 |
\s | 查找空白字符。 |
\S | 查找非空白字符。 |
\b | 匹配单词边界。 |
\B | 匹配非单词边界。 |
\0 | 查找 NULL 字符。 |
\n | 查找换行符。 |
\f | 查找换页符。 |
\r | 查找回车符。 |
\t | 查找制表符。 |
\v | 查找垂直制表符。 |
\xxx | 查找以八进制数 xxx 规定的字符。 |
\xdd | 查找以十六进制数 dd 规定的字符。 |
\uxxxx | 查找以十六进制数 xxxx 规定的 Unicode 字符。 |
检查一个字符串中是否含有.
(在正则表达式中\
表示转义字符)
var reg = /\./;//检查字符串中是否有点.
注意使用构造函数时,由于参数是字符串,而\
是字符串中的转义字符,如果要使用\
则要使用\\
代替。
var reg = new RegExp("\\.");//检查字符串中是否有点.
支持正则表达式的 String 对象的方法
方法 | 描述 | FF | IE |
---|---|---|---|
search | 检索与正则表达式相匹配的值。 | 1 | 4 |
match | 找到一个或多个正则表达式的匹配。 | 1 | 4 |
replace | 替换与正则表达式匹配的子串。 | 1 | 4 |
split | 把字符串分割为字符串数组。 | 1 | 4 |
split()
可以将一个字符串拆分为一个数组。即使不指定全局匹配也会全都拆分。
如果想根据任意字母将字符串进行拆分:(方法中可以传递一个正则表达式作为参数,这样方法会根据正则表达式去拆分字符串)
split(/[A-z]/);
用正则表达式与split()配合更加灵活。
search()
可以搜索字符串中是否含有指定内容。
如果搜索到指定内容则会返回第一次出现的索引。没有搜索到则返回-1。它可以接收一个正则表达式为参数,然后会根据正则表达式去检索字符串。只会查找第一个,即使设置全局匹配也没用。
搜索字符串中是否含有abc或aec或afc:
search(/a[bef]c/);
match()
可以根据正则表达式,从一个字符串中,将符合条件的内容提取出来。默认情况下,match()
只会找到第一个符合要求的内容,找到以后则会停止检索。我们可以设置正则表达式为全局匹配模式。这样就会匹配到所有的内容。
如果想将所有字母都提取出来:
match(/[A-z]/g);
可以为一个正则表达式设置多个匹配模式,且顺序无所谓:
match(/[a-z]/gi);//g表示全局匹配模式,i表示忽略大小写
match(/[a-z]/ig);
match()
会将匹配到的内容封装到一个数组中返回,即使只查询到一个结果。
replace()
可以将字符串中指定内容替换为新的内容。
- 参数:1. 被替换的内容。2. 新的内容。
- 默认只会替换第一个。可以接受正则表达式作为参数。
replace(/[a-z]gi/,"*");//将字母都替换为*
replace(/[a-z]gi/,"");//将字母删除
电子邮件的正则练习
格式:hello.world@abc.com.cn
-
开头:任意字母、数字、下划线、点(.)、任意字母、数字、下划线。
-
@
-
@后:任意字母数字–>点(.)–>任意字母(2-5位) -->点(.)–>任意字母(2-5位)
var emaiReg = /^w{3,}(\.\w+)*@[A-z0-9]+(\.[A-z]{2,5}){1,2}$;
其实常用的正则表达式也可以上网找找。
数字相关的正则表达式
数字:^[0-9]*$
n位定长的数字:^\d{n}$
m-n位之间的数字:^\d{m,n}$
零和非零开头的数字:^(0|[1-9][0-9]*)$
非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$
正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$
有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
正整数:^\d+$
或 ^[1-9]\d*|0$
负整数:^-[1-9]\d*|0$
或 ^((-\d+)|(0+))$
正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$
或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$
或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
浮点数:^(-?\d+)(\.\d+)?$
或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
字符相关的正则表达式
汉字:^[\u4e00-\u9fa5]{0,}$
长度为3-20的所有字符:^.{3,20}$
由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
由数字、26个英文字母或者下划线组成的字符串:^\w+$
或 ^\w{3,20}$
中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$
或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
固定格式约定俗成的正则表达式
Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
网站域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
URL网址:^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
手机号码:^(13[0-9]|17[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
电话号码 (“XXX-XXXXXXX”、”XXXX-XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
身份证号(15位、18位数字):^\d{15}|\d{18}$
日期格式:^\d{4}-\d{1,2}-\d{1,2}
一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
腾讯QQ号:[1-9][0-9]{4,8}
(腾讯QQ号从10000开始,目前最长为10位)
中国邮政编码:[1-9]\d{5}(?!\d)
(中国邮政编码为6位数字)
IP地址:\d+\.\d+\.\d+\.\d+
(提取IP地址时有用)
IP地址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))