正则表达式
正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来匹配有规律得表达式。
常用于表单得校验和高级搜索。
说白了正则表达式就是处理字符串的,我们可以用它来处理一些复杂的字符串。
为什么要学习正则表达式
我们直接用一个例子来说明
//找出这个字符串中的所有数字
var str = ‘abc123de45fgh6789qqq111’;
//方法1
function findNum(str) {
var tmp = '',
arr = [];
for (var i = 0; i < str.length; i++) {
var cur = str[i];
if (!isNaN(cur)) {
tmp += cur;
} else {
if (tmp) {
arr.push(tmp);
tmp = '';
}
}
}
if (tmp) {
arr.push(tmp)
}
return arr;
}
console.log(findNum(str))
//["123", "45", "6789", "111"]
//方法2 使用正则表达式
var reg = /\d+/g;
console.log(str.match(reg))
// [“123”, “45”, “6789”, “111”]
创建正则表达式
构造函数的方式
var regExp = new RegExp(/\d/);
正则字面量
var regExp = /\d/;
正则的使用
/\d/.test("aaa1");
元字符
正则表达式由一些普通字符和元字符组成,普通字符包括大小写字母、数字等,而元字符则具有特殊的含义。
常见元字符
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-A97TOej8-1580745155068)(images\yuan.png)]
字符类的元字符
[]
在正则表达式中表示一个字符的位置,[]里面写这个位置可以出现的字符。
console.log(/[abc]/);//匹配a,b,c
[^]
在中扩号中的^表示非的意思。
//^表示该位置不可以出现的字符
console.log(/[^abc]/);//匹配除了a,b,c以外的其他字符
[a-z]
[1-9]
表示范围
console.log(/[a-z]/.test("d"));//小写字母
console.log(/[A-Z]/.test("d"));//大写字母
console.log(/[0-9]/.test("8"));//数字
console.log(/[a-zA-Z0-9]/);//所有的小写字母和大写字母以及数字
边界类元字符
我们前面学习的正则只要有满足的条件的就会返回true,并不能做到精确的匹配。
^表示开头 []里面的^表示取反
$表示结尾
console.log(/^chuan/.test("dachuan"));//必须以chuan开头
console.log(/chuan$/.test("chuang"));//必须以chuan结尾
console.log(/^chuan$/.test("chuan"));//精确匹配chuan
//精确匹配chuan,表示必须是这个
console.log(/^chuan$/.test("chuanchuan"));//fasle
量词类元字符
量词用来控制出现的次数,一般来说量词和边界会一起使用
*
表示能够出现0次或者更多次,x>=0;+
表示能够出现1次或者多次,x>=1?
表示能够出现0次或者1次,x=0或者x=1{n}
表示能够出现n次{n,}
表示能够出现n次或者n次以上{n,m}
表示能够出现n-m次
思考:如何使用{}来表示*+?
\d : 0-9之间的任意一个数字 \d只占一个位置
\w : 数字,字母 ,下划线 0-9 a-z A-Z _
\s : 空格或者空白等
\D : 除了\d
\W : 除了\w
\S : 除了\s
. : 除了\n之外的任意一个字符
\ : 转义字符
| : 或者
() : 分组
\n : 匹配换行符
\b : 匹配边界 字符串的开头和结尾 空格的两边都是边界 => 不占用字符串位数
^ : 限定开始位置 => 本身不占位置
$ : 限定结束位置 => 本身不占位置
[a-z] : 任意字母 []中的表示任意一个都可以
[^a-z] : 非字母 []中^代表除了
[abc] : abc三个字母中的任何一个 [^abc]除了这三个字母中的任何一个字符
|表示或,优先级最低 ()优先级最高,表示分组
正则的使用
这里我们只介绍test、exec两个方法
- reg.test(str)用来验证字符串是否符合正则 符合返回true 否则返回false
var str = 'abc';
var reg = /\w+/;
console.log(reg.test(str)); //true
- reg.exec() 用来捕获符合规则的字符串
var str = 'abc=‘123cba456aaa789';
var reg = /\d+/;
console.log(reg.exec(str))
// ["123", index: 3, input: "abc123cba456aaa789"];
console.log(reg.lastIndex)
// lastIndex : 0
reg.exec捕获的数组中
// [0:"123",index:3,input:"abc123cba456aaa789"]
0:"123" 表示我们捕获到的字符串
index:3 表示捕获开始位置的索引
input 表示原有的字符串
当我们用exec进行捕获时,如果正则没有加’g’标识符,则exec捕获的每次都是同一个,当正则中有’g’标识符时 捕获的结果就不一样了,我们还是来看刚刚的例子
正则测试
-
验证座机
- 比如010-12345678 0797-1234567
- 开头是3-4位,首位必须是0
- -后面是7-8位
var phoneReg = /^0\d{2,3}-\d{7,8}$/;
-
验证姓名
- 只能是汉字
- 长度2-6位之间
- 汉字范围[\u4e00-\u9fa5]
var nameReg = /^[\u4e00-\u9fa5]{2,6}$/;
-
验证QQ
- 只能是数字
- 开头不能是0
- 长度为5-11位
var qqReg = /^[1-9]\d{4,10}$/;
-
验证手机
- 11位数字组成
- 号段13[0-9] 147 15[0-9] 17[0178] 18[0-9]
var mobileReg = /^(13[0-9]|147|15[0-9]|17[0178]|18[0-9])\d{8}$/;
-
验证邮箱
- 前面是字母或者数字
- 必须有@
- @后面是字母或者数字
- 必须有.
- .后面是字母或者数字
var emailReg = /^\w+@\w+(\.\w+)+$/;
正则替换
var str = " 123AD asadf asadfasf adf ";
1 替换掉字符串中的所有空白
2. 将所有的ad替换成xx
3. 将所有的ad/AD替换成xx
var str = "abc,efg,123,abc,123,a"
4. 所有的逗号替换成句号
var jsonStr = '[{"name":"张三",score:80},{"name":"张三",score:90},{"name":"张三",score:81}]';
5. 把所有成绩都修改成100分
常用函数
一、test(),用于检测一个字符串是否匹配某个正则表达式
使用方法:
RegExpObject.test(string)
其中RegExpObject代表正则表达式,string代表需要检测的字符串。该方法返回一个布尔值,true代表匹配成功,false代表失败。
举个栗子~
var str1 = 'Hello,我叫Real';
var str2 = '大家好,我叫张三';
这里有两个字符串(本文所有例子都将使用到这两个字符串),接下来我想要检测字符串中是否存在英文字符串,这时就可以使用test()来实现:
console.log(/\w+/.test(str1)); //true
console.log(/\w+/.test(str2)); //false
二、match(),可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配
使用方法:
stringObject.match(searchvalue)
stringObject.match(regexp)
其中stringObject代表需要匹配的字符串,searchvalue代表需要从字符串中检索的内容,regexp代表正则表达式。
三、replace(),用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串
使用方法:
stringObject.replace(regexp/substr,replacement)
其中stringObject与regexp同上,substr代表需要被替换掉的子字符串,replacement代表替换文本或生成替换文本的函数。该方法返回替换成功之后的字符串。
举个栗子~
console.log(str1.replace('Hello','Hi')); // "Hi,我叫Real"
console.log(str1.replace(/Hello/,'Hi')); // "Hi,我叫Real"
console.log(str2.replace(/Hello/,'Hi')); // 未匹配到被替换内容,返回原字符串"大家好,我叫张三"
str3 = "Hi,Real";
console.log(str3.replace(/(\w+),(\w+)/, "$2,$1")); //将子字符串交换位置,返回"Real,Hi"
console.log(str1.replace(/\w+/,function(word){ //将字符串中的第一个匹配元素改为大写,返回字符串"HELLO,我叫Real"
return word.toUpperCase();
}));
四、search(),用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串
使用方法:
stringObject.search(searchvalue)
stringObject.search(regexp)
其中stringObject与regexp同上,返回stringObject中第一个与 regexp 相匹配的子串的起始位置。
同样举个例子:
console.log(str1.search(/\w+/)); // 0
console.log(str1.search('Real')); // 8
console.log(str1.search(/\w+/g)); // 0
console.log(str2.search(/\w+/)); // -1