正则表达式(reg),又称规则表达式。计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个规则的文本。正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
基础语法
-
字面量匹配
-
特殊字符
-
. 匹配所有字符
-
^ 匹配以某个字符串开头
-
$ 匹配以某个字符串结尾
-
-
转义符 \n 匹配一个换行 \d 匹配数字 \D 匹配所有非数字的字符 \s 匹配所有的空白字符 \S 匹配所有的非空白字符 \b 匹配单词边界 \B 匹配非单词边界的字符 \w 匹配字母、数字、下划线 \W 匹配非字母、数字、下划线 \u 匹配unicode字符编码
\u4e00-\u9fa6
-
. 匹配字符 .
-
\ 匹配单斜杠
-
字符集 [abc]
匹配所有的字母
匹配所有的数字 匹配所有的中文
-
量词
- 匹配0次或者多次
- 匹配一次或者多次
-
? 匹配0次或者一次
-
{n} 匹配n次
-
{n,m} 匹配n-m次
-
{n,} 匹配>=n次
-
或者 |
-
集合 ( )
常用正则表达式
- 数字:^[0-9]*$
- n位的数字:^\d{n}$
- 正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$
- 汉字:^[\u4e00-\u9fa5]{0,}$
- 英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
- 中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
- 中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
- Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
- 手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|4|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
- 身份证号(15位、18位数字),最后一位是校验位,可能为数字或字符X:(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
- 帐号(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
- 密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
- 强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在 8-10 之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
- 强密码(必须包含大小写字母和数字的组合,可以使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
- 日期格式:^\d{4}-\d{1,2}-\d{1,2}
- 一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
- 一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
- 腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)
- 中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
js中的正则应用
js中,正则是一个对象,使用RegExp构造函数去创建
标志
g:全局匹配模式
i:忽略大小写
正则实例方法
-
test() 测试数据是否满足规则 返回值为 true/false
-
exec() 执行匹配 并且得到返回结果
match : 得到匹配的结果 如果正则不是全局匹配 返回值与exec相同
search : 得到第一个匹配结果的下标 在当前方法下 全局匹配失效
replace : 替换
split : 将一个字符串以指定的符号进行分割 分割为一个数组
join: 将数组转换为字符串