js中的正则表达式
概述
用于匹配规律规则的表达式,正则表达式最初是科学家对人类神经系统的工作原理的早期研究,现在在编程语言中有广泛的应用。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
使用
1.不能直接使用,配合方法使用,正则一般都是用来验证字符的。
2.筛选出符合条件的子串,替换符合条件的子串,验证字符是否符合规则。
常用的正则字符
-
转义符
\d:匹配任意数字
\D:匹配任意非数字
\w:匹配任意字母数字下划线
\W:匹配任意非数字字母下划线
\s:匹配任意的空白符
\S:匹配任意的非空白符
():一个独立的部分
[]:中元符,也表示一个独立的部分,内部内容是或的关系,一个中元符只能匹配一个字符
^:在中元符的第一位表示非,也表示匹配行首的文本 -
限定符
*:重复零次或更多次
+:重复一次或更多次
?:重复一次或零次
{n}:重复n次
{n,}:重复n次或更多次
{n,m}:重复n-m次 -
参数
g:全局匹配
i:忽略大小写
gi:全局匹配+忽略大小写
正则表达式定义方式
使用RegExp构造函数
它接收两个参数:一个是要匹配的字符串模式,另一个是可选的标志字符串。可以使用字面量定义的任何表达式,都可以使用构造函数来定义,如,匹配第一个bat或者cat,不区分大小写:
var pattern = new RegExp("[bc]at","i");
注意:RegExp构造函数模式参数时字符串,所以再某些情况下要对字符进项双重转义。所有元字符都必须双重转义,如字面量模式为/[bc]at/,那么等价的字符串为"/\[bc\]at/"
正则表达式的方法
RegExp对象的exec()方法
该方法是专门为捕获组而设计的,其接受一个参数,即要应用模式的字符串,然后返回包含第一个匹配项信息的数组;或者在没有匹配项的情况下返回null。返回的数组虽然是Array的实例,但是包含两个额外的属性:index和input。其中index表示匹配项在字符串中的位置,而input表示应用字符串表达式的字符串。
var str = "123hfgh789hgf25ghf456hg3.14f";
var reg = /\d+/g;
console.log(str.match(reg));
console.log(reg.exec(str));
reg.lastIndex = 0;
console.log(reg.exec(str));
reg.lastIndex = 0;
console.log(reg.exec(str));
console.log(reg.lastIndex)
var arr = null;
while(arr = reg.exec(str)){
console.log(arr)
}
对于exec()方法而言,即使在模式中设置了全局标志g,它每次也只是返回一个匹配项。在不设置全局标志的情况下,在同一个字符串上多次调用exec()方法将始终返回第一个匹配项的信息。而在设置全局标志的情况下,每次调用exec()则都会在字符串中继续查找新匹配项
test()方法
正则表达式常用方法test(),它接受一个字符串参数。在模式与该参数匹配的情况下返回true,否则返回false。
用法:正则.test(字符串)
例:判断是否是数字:
var str = '374829348791';
var re = /\D/; // \D代表非数字
if( re.test(str) ){ // 返回true,代表在字符串中找到了非数字。
alert('不全是数字');
}else{
alert('全是数字');
}
search()方法
在字符串搜索符合正则的内容,搜索到就返回出现的位置(从0开始,如果匹配的不只是一个字母,那只会返回第一个字母的位置), 如果搜索失败就返回 -1
用法:字符串.search(正则)
例:在字符串中找字母b,且不区分大小写:
var str = 'abcdef';
var reg = /B/i;
//var reg = new RegExp('B','i'); 也可以这样写
alert( str.search(reg) ); // 1
match方法
语法:
stringObject.match(searchvalue)
stringObject.match(regexp)
- searchvalue:必需。规定要检索的字符串值。
- regexp:必需。规定要匹配的模式的 RegExp 对象。如果该参数不是 RegExp 对象,则需要首先把它传递给 RegExp
构造函数,将其转换为 RegExp 对象。
如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组。
例如:
"186a619b28".match(/\d+/g); // ["186","619","28"]
如果上面的匹配不是全局匹配,那么得到的结果如下:
[“186”, index: 0, input: “186a619b28”]
replace方法
replace 本身是JavaScript字符串对象的一个方法,它允许接收两个参数:
replace([RegExp|String],[String|Function])
第1个参数可以是一个普通的字符串或是一个正则表达式.
第2个参数可以是一个普通的字符串或是一个回调函数.
如果第2个参数是回调函数,每匹配到一个结果就回调一次,每次回调都会传递以下参数:
- result: 本次匹配到的结果
- 1,…1,…9: 正则表达式中有几个(),就会传递几个参数,1 1 9分别代表本次匹配中每个()提取的结果,最多9个
- offset:记录本次匹配的开始位置
- source:接受匹配的原始字符串
replace()方法全局替换变量:
- 简单替换字符:string.replace(“a”,“b”); (把 a 替换成 b)
- 全局替换字符:string.replace(/a/g,“b”);(全局把a替换成b)
但是如果是全局替换一个变量内容,如下,给一个电话号码中间加*号:
var phone = "15512345678";
var sliceNumber = phone.slice(3,phone.length - 3);
var newPhone = phone.replace(new RegExp(sliceNumber,'g'),'****');
console.log(newPhone); //155****678
常用的验证例子:
手机号:
var str = "156644645541"
var reg = /^1\d{10}$/
console.log(reg.test(str))
文件格式验证:
var str = "in_2dex.html"
var reg = /^\w{1,8}\.[a-z]{2,4}$/
console.log(reg.test(str))
字符串首尾去空格:
var str = " sSdAScadasdasdadas "
console.log(str)
str.replace(/^\s+/,'');
str.replace(/\s+$/,'')
console.log(str)
邮箱验证:
var str = "246121"
var reg = /^[1-9]\d{5}$/
console.log(reg.test(str))