正则
-
正则表达式,又名 “规则表达式”
-
JS 中的数据类型, 是一个复杂数据类型
-
由我们自己来书写 “规则”,专门用来检测 字符串 是否符合 “规则” 使用的
-
我们使用一些特殊的字符或者符号定义一个 “规则公式”,然后用我们定义好的 “规则公式” 去检测字符串是不是合格
var reg = /\d+/ var str1 = '123' var str2 = 'abc' console.log(reg.test(str1)) // true console.log(reg.test(str2)) // false
- 上面的变量
reg
就是定制好的规则 - 检测
str1
这个字符串的时候,符合规则 - 检测
str2
这个字符串的时候,不符合规则
- 上面的变量
创建一个正则表达式
- 想制定 “规则”,必须要按照人家要求的方式来制定
- 把一些字母和符号写在
//
中间的东西,叫做正则表达式,比如/abcdefg/
- 创建正则表达式有两个方式 字面量 和 构造函数创建
字面量创建
// 下面就是字面量创建一个正则表达式
var reg = /abcdefg/
- 这个正则表达式就可以去检测字符串了
构造函数创建
// 下面就是构造函数创建一个正则表达式
var reg = new RegExp('abcdefg')
console.log(reg) // /abcdefg/
- 使用构造函数方式创建的和字面量创建的,得到的结果一样
两种创建正则表达式的区别 *****
- 语法不一样
- 书写标识符的时候
=> 字面量方式直接书写在正则的后面
=> 内置构造函数, 以第二个参数的方式传递 - 拼接字符串
=> 字面量方式不接受拼接字符串
=> 内置构造函数方式, 可以拼接字符串 - 基本元字符书写
=> 字面量方式的时候, 直接书写 \s\d\w
=> 内置构造函数书写的时候, 需要书写 \s\d\w
为什么内置构造函数需要书写双斜线
- 字符串
=> 被引号包裹的所有内容叫做字符串
=> 当你在字符串内书写 斜线() 的时候, 是表示转义符号
=> 会把紧挨着他的一个内容转换
-> 如果是有意义的内容转换成没有意义的内容
-> 如果是没有意义的内容转换成有意义的内容
-> 例子: n 是一个没有意义的字母
+ 当 n 和 转义符 在一起的时候, 就表示 换行 - new RegExp()
=> 第一个参数需要一个字符串
=> 你写的字符串就是正则内部的内容
=> 如果你想得到 /\s\d\w/
=> 那么你要给他的字符串里面写上 \s\d\w
=> 但是, 因为在字符串中 \ 是转义符
=> 当你书写字符串 ‘\s’ 的时候, \ 就会把 s 转换成有意义的特殊内容
-> 可以字符串中确实没有 \s 组成的特殊意义字符, 所以就变成了一个 单独的 字母 s - 解决问题:
=> 使用 \ 把有意义的特殊字符 \ 转换成没有意义的文本
=> 当你书写 ‘\s\d\w’ 的时候, 实际字符串就是 ‘\s\d\w’
正则表达式里面的符号
- 知道了怎么创建一个正则表达式以后,我们就来详细的说一下正则表达式里面涉及到的一些符号了
元字符
-
.
: 匹配非换行的任意字符 -
\
: 转译符号,把有意义的 符号 转换成没有意义的 字符,把没有意义的 字符 转换成有意义的 符号 -
\s
: 匹配空白字符(空格/制表符/…) -
\S
: 匹配非空白字符 -
\d
: 匹配数字 -
\D
: 匹配非数字 -
\w
: 匹配数字字母下划线 -
\W
: 匹配非数字字母下划线 -
有了元字符我们就可以简单的制定一些规则了
var reg = /\s/ var str = 'a b' var str2 = 'ab' console.log(reg.test(str)) // true console.log(reg.test(str2)) // false
var reg = /\d/ var str = 'abc1' var str2 = 'abc' console.log(reg.test(str)) // true console.log(reg.test(str2)) // false
var reg = /\w/ var str = 'a1' var str2 = '#@$' console.log(reg.test(str)) // true console.log(reg.test(str2)) // false
限定符
-
*
: 前一个内容重复至少 0 次,也就是可以出现 0 ~ 正无穷 次 -
+
: 前一个内容重复至少 1 次,也就是可以出现 1 ~ 正无穷 次 -
?
: 前一个内容重复 0 或者 1 次,也就是可以出现 0 ~ 1 次 -
{n}
: 前一个内容重复 n 次,也就是必须出现 n 次 -
{n,}
: 前一个内容至少出现 n 次,也就是出现 n ~ 正无穷 次 -
{n,m}
: 前一个内容至少出现 n 次至多出现 m 次,也就是出现 n ~ m 次 -
限定符是配合元字符使用的
// 下面正则表示验证数字出现 0 ~ 正无穷次都可以
var reg = /\d*/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
console.log(reg.test(str)) // true
console.log(reg.test(str2)) // true
console.log(reg.test(str3)) // true
// 下面正则表示验证数字出现 1 ~ 正无穷次都可以
var reg = /\d+/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
console.log(reg.test(str)) // false
console.log(reg.test(str2)) // true
console.log(reg.test(str3)) // true
// 下面正则表示验证数字出现 0 ~ 1 次都可以
var reg = /\d?/
var str = 'abc'
var str2 = 'abc1'
console.log(reg.test(str)) // true
console.log(reg.test(str2)) // true
// 下面正则表示验证数字必须出现 3 次
var reg = /\d{3}/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
console.log(reg.test(str))
// falseconsole.log(reg.test(str2))
// falseconsole.log(reg.test(str3)) // true
// 下面正则表示验证数字出现 3 ~ 正无穷次
var reg = /\d{3,}/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
var str4 = 'abcd1234567'
console.log(reg.test(str))
// falseconsole.log(reg.test(str2))
// falseconsole.log(reg.test(str3))
// trueconsole.log(reg.test(str4)) // true
// 下面正则表示验证数字只能出现 3 ~ 5 次
var reg = /\d{3,5}/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
var str4 = 'abc12345'
console.log(reg.test(str))
// falseconsole.log(reg.test(str2))
// falseconsole.log(reg.test(str3))
// trueconsole.log(reg.test(str4)) // true
边界符
-
^
: 表示开头 -
$
: 表示结尾 -
边界符是限定字符串的开始和结束的
// 下面表示从开头到结尾只能有数字,并且出现 3 ~ 5 次
var reg = /^\d{3,5}$/
var str = 'abc'
var str2 = 'abc123'
var str3 = '1'
var str4 = '1234567'
var str5 = '123'
var str6 = '12345'
console.log(reg.test(str)) // false
console.log(reg.test(str2)) // false
console.log(reg.test(str3)) // false
console.log(reg.test(str4)) // false
console.log(reg.test(str5)) // true
console.log(reg.test(str6)) // true
特殊符号
-
()
: 限定一组元素 -
[]
: 字符集合,表示写在[]
里面的任意一个都行 -
[^]
: 反字符集合,表示写在[^]
里面之外的任意一个都行 -
-
: 范围,比如a-z
表示从字母 a 到字母 z 都可以 -
|
: 或,正则里面的或a|b
表示字母 a 或者 b 都可以 -
现在我们就可以把若干符号组合在一起使用了
// 下面是一个简单的邮箱验证// 非_$开头,任意字符出现至少6次,一个@符号,(163|126|qq|sina)中的任意一个,一个点,(com|cn|net)中的任意一个var reg = /^[^_$].{5,}@(163|126|qq|sina)\.(com|cn|net)$/
标识符
i
: 表示忽略大小写- 这个 i 是写在正则的最后面的
/\w/i
- 就是在正则匹配的时候不去区分大小写
g
: 表示全局匹配- 这个 g 是写在正则的最后面的
/\w/g
- 就是全局匹配字母数字下划线
正则表达式的方法
- 正则提供了一些方法给我们使用
- 用来检测和捕获字符串中的内容的
test
-
test
是用来检测字符串是否符合我们正则的标准 -
语法:
正则.test(字符串)
-
返回值: boolean
console.log(/\d+/.test('123')) // true console.log(/\d+/.test('abc')) // false
exec
-
exec
是把字符串中符合条件的内容捕获出来 -
语法:
正则.exec(字符串)
-
返回值: 把字符串中符合正则要求的第一项以及一些其他信息,以数组的形式返回
var reg = /\d{3}/ var str = 'hello123world456你好789' var res = reg.exec(str) console.log(res) /* ["123", index: 5, input: "hello123world456你好789", groups: undefined] 0: "123" groups: undefined index: 5 input: "hello123world456你好789" length: 1 __proto__: Array(0)*/
- 数组第 0 项就是匹配到的字符串内容
- index 属性表示从字符串的索引几开始是匹配的到字符串
exec() 捕获
=> 语法: 正则.exec(字符串)
=> 作用: 从 字符串中 把满足正则条件的部分获取出来
=> 返回值:
-> 原始字符串中没有符合正则要求的字符串片段
+ null
-> 原始字符串中有符合正则要求的片段
+ 正则没有 () 也没有 全局标识符g
+ 返回值是一个数组
+ 索引 0 是从字符串中捕获出来的满足正则条件的第一个内容
+ 注意: 不管捕获多少次, 每次都是从原始字符串的索引 0 开始检索
+ 正则有全局标识符 g
+ 返回值是一个数组
+ 索引 0 是从字符串中捕获出来的满足正则条件的第一个内容
+ 注意: 第二次捕获是从第一次的结束位置开始向后查询, 直到最后捕获不到为止, 再下一次的时候, 又从字符串的 索引0 开始检索
+ 有 ()
+ 返回的是一个数组
+ 索引 0 是从字符串中捕获出来的满足正则条件的第一个内容
+ 从索引 1 开始, 依次是每一个小括号的单独内容
+ 注意: 按照小括号的开始标志, 来数是第几个小括号
扩展:
+ () 有两个意义
=> 一个整体
=> 单独捕获
+ 如果你想只使用一个意义, 整体的所用, 不想在捕获的时候单独捕获出来
=> 你可以写成 (?:)
=> 匹配但不捕获
字符串的方法
- 字符串中有一些方法也是可以和正则一起使用的
search
-
search
是查找字符串中是否有满足正则条件的内容 -
语法:
字符串.search(正则)
-
返回值 : 有的话返回开始索引,没有返回 -1
var reg = /\d{3}/ var str = 'hello123' var str2 = 'hello' console.log(str.search(reg)) // 5 console.log(str2.search(reg)) // -1
match
-
match
找到字符串中符合正则条件的内容返回 -
语法:
字符串.match(正则)
-
返回值 :
- 没有标示符 g 的时候,是和 exec 方法一样
- 有标示符 g 的时候,是返回一个数组,里面是匹配到的每一项
var reg = /\d{3}/ var str = 'hello123world456' var str2 = 'hello' console.log(str.match(reg)) // ["123", index: 5, input: "hello123wor456", groups: undefined] console.log(str2.match(reg)) // null
var reg = /\d{3}/g var str = 'hello123world456' var str2 = 'hello' console.log(str.match(reg)) // ["123", "456"] console.log(str2.match(reg)) // null
正则的两个特性
-
懒惰性
=> 每一次捕获都是从原始字符串的索引 0 位置开始检索
=> 解决: 使用全局标识符 g -
贪婪性
=> 贪婪匹配: 能拿多少拿多少 尽可能多的匹配内容
=> 非贪婪匹配: 能拿多少拿多少 尽可能少的匹配内容
-> 需要使用非贪婪限定符
-> 在原先的限定符后面再写一个 ?
-> *? 0 ~ 多次, 但是 0 次能解决问题, 就不在多
-> +? 1 ~ 多次, 但是 1 次能解决问题, 就不在多
-> ?? 0 ~ 1次, 0 次能解决问题, 就不去管 1 次
-> {n,}?
-> {n,m}?
replace
-
replace
是将字符串中满足正则条件的字符串替换掉 -
语法:
字符串.replace(正则,要替换的字符串)
-
返回值 : 替换后的字符串
var reg = /\d{3}/ var str = 'hello123world456' var str2 = 'hello' console.log(str.replace(reg)) // hello666world456 console.log(str2.replace(reg)) // hello
var reg = /\d{3}/g var str = 'hello123world456' var str2 = 'hello' console.log(str.replace(reg)) // hello666world666 console.log(str2.replace(reg)) // hello