正则表达式的概述
正则表达式是用于匹配字符串中字符组合的模式。在JavaScript中,正则表达式也是对象
正则表通常被用来检索,替换那些符合某个模式(规则)的文本,例如验证表单:用户名表只能输入英文字母,数字或者下划线,昵称输入框可以输入中文(匹配)。此外,正则表达式还常用于过滤掉页面内容中的一些敏感词汇(替换),或从字符串中获取我们想要的特定部分(提取)等
正则表达式的特点
-
灵活性,逻辑性和功能性非常的强
-
可以迅速地用简单的方式达到字符串的复制控制
-
对于刚接触的人来说,比较难懂,比如:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w*$
-
实际开发,一般都是直接复制写好的正则表达式,但是要求会使用正则表达式并且根据实际情况修改正则表达式
创建正则表达式
在JavaScript中可以通过两种方法来创建正则表达式
- 通过调用RegExp 对象的构造函数创建
var x = new RegExp(/表达式/);
- 通过字面量创建
var x = /表达式/;
测试正则表达式 test
test()正则对象方法,用于检测字符串是否符合该规则,该对象会返回true 或 false ,其参数是测试字符串
regexObj.test(str);
- regexObj 是写的正则表达式
- str 我们要测试的文本
- 就是检测str文本是否符合我们写的正则表达式规范
正则表达式中的特殊字符
一个正则表达式可以由简单的字符构成,比如/abc/,也可以是简答和特殊字符的组合,比如/ab*c/。其中特殊字符也被称为元字符,在正则表达式中是具有特殊意义的专用符号。如 ^ $ + - 等
边界符
正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符
边界符 | 说明 |
---|---|
^ | 表示匹配行首的文本(以谁开始) |
$ | 表示匹配行尾的文本(以谁结尾) |
//边界符
var rg = /abc/; //正则表达式里面不需要加引号 不管是数字还是字符串
// /abc/ 只要包含有 abc这个字符串返回的都是true
console.log(rg.test('abc'));
console.log(rg.test('abcd'));
console.log(rg.test('aabc'));
console.log('----------------------------');
var reg = /^abc/;
console.log(rg.test('abc')); //true
console.log(rg.test('abcd')); //true
console.log(rg.test('aabc')); //false
console.log('-------------');
结尾同理
var reg = /^abc$/; //精确匹配 要求必须是 abc字符串才符合规范
console.log(rg.test('abc')); //true
console.log(rg.test('abcd')); //false
console.log(rg.test('aabc')); //false
console.log(rg.test('abcabc')); //false
如果 ^ 和 $ 在一起就表示必须是精确匹配
字符类
[]表示有一系列字符可供选择,只要匹配其中一个就可以了
[-] 表示范围
var rg = /[abc]/; //只要包含有a 或者 有b 或者有c 都返回为true
consloe.log(rg.test('andy')); //true
var rg1 = /^[abc]$/; //三选一 只有是a 或者是b 或者是c 这三个字母才返回true
console.log(rg1.test('a')); //true
console.log(rg1.test('b')); //true
console.log(rg1.test('c')); //true
console.log(rg1.test('aa')); //false
console.log(rg1.test('abc')); //false
console.log(rg1.test('bb')); //false
consloe.log('--------------');
var rg2 = /^[a-z]$/; //26个英文字母任何一个字母返回 true
console.log(rg2.test('a')); //true
console.log(rg2.test('z')); //true
console.log(rg2.test('A')); //false
//字符组合
var reg = /^[a-zA-Z0-9]$/ 英文字母和数字
如果中括号里面有^ 表示取反的意思 千万别和边界符 混淆了
var reg1 = /^[^ a-z]$/;
也就是不能取这些
量词符
量词符是用来设定某个模式出现的次数
量词 | 说明 |
---|---|
* | 重复零次或更多次 |
+ | 重复一次或更多次 |
? | 重复零次或一次 |
{n} | 重复n次 |
{n,} | 重复n次或更多次 |
{n,m} | 重复n到m次 |
// * 相当于 >=0 可以出现0次或者很多次
var reg = /^a*$/;
console.log('a'); //true
console.log(''); //true
console.log('aaa'); //true
//+ 相当于 >=1 可以出现1次或者很多次
//{3} 就是三次 {3,} 是大于等于3次 {3,16} 就是3到16次
预定义类
预定义类指的是某些常见模式的简写模式
预定义类 | 说明 |
---|---|
\d | 匹配0-9之间的任一数字,相当于[0-9] |
\D | 匹配所有0-9以外的字符,相当于[^0-9] |
\w | 匹配任意的字母,数字,下划线,相当于[A-Za-z0-9_] |
\W | 除所有字母,数字,下划线以外的字符 |
\s | 匹配空格(包括换行符,制表符,空格符),相等于[\t\r\n\v\f] |
\S | 匹配非空格的字符 |
正则表达式中的替换
replace()方法可以实现替换字符串操作,用来替换掉参数可以是一个字符串或是一个正则表达式
stringObject.replace(refexp/substr,replacement)
- 第一个参数:被替换的字符串或者正则表达式
- 第二个参数:替换为的字符串
- 返回值是一个替换完毕的新字符串
正则表达式参数
/表达式/[switch] /andy/g
switch(也称为修饰符)按照什么样的模式来匹配,有三种值
- g:全局匹配
- i:忽略大小写
- gi:全局匹配 + 忽略大小写