什么是正则表达式
正则表达式(Regular Expression)是用于匹配字符串中字符组合的模式。在JS中,正则表达式也是对象。
正则表达式的作用
- 表单验证:用户表单只能输入英文字母、数字或者下划线,昵称输入框可以输入中文(匹配)
- 过滤敏感词:过滤掉页面内容中一些敏感词(替换)
- 获取指定内容:从字符串中获取我们想要的特定部分(提取)
正则表达式的特点
优点
- 灵活性、逻辑性和功能性非常强。
- 可以快速地用极简单的方式达到对字符串的复杂控制。
缺点
- 对于新手来说,比较晦涩难懂,难以记住。
实际开发中,一般是直接复制写好的正则表达式,但是要求会使用正则表达式并且根据实际情况修改正则表达式
正则表达式在JS中的使用
创建正则表达式
在JS中,可以通过两种方式创建一个正则表达式
通过调用RegExp对象的构造函数创建
var 变量名 = new RegExp(/表达式/);
通过字面量创建
var 变量名 = /表达式/;
测试正则表达式 test
text()正则对象方法,用于检测字符串是否符合该规则,该对象返回true或false,其参数是测试字符串.
regexObj.test(str)
regexObj:正则表达式 || str:要检测的文本
正则表达式的组成
一个正则表达式可以由简单的字符构成,比如/tkrj/,也可以是简单和特殊字符的组合,比如/t*krj/。特殊字符也被称为元字符,在正则表达式中具有特殊意义的专用符号,如^、$、+等等。
特殊字符可以参考:
边界符(位置符)
正则表达式中边界符用来提示字符所处位置
边界符 | 说明 |
---|---|
^ | 表示匹配行首的文本(以谁开始) |
$ | 表示匹配行尾的文本(以谁结束) |
如果^和$在一起,表示必须是精确匹配
字符类
[] 表示一系列字符,只要匹配其中一个就可以了
比如: /[abc]/ 表示只要包含a或b或c都返回true
[-] 方括号里“-”表示范围符
比如: /[a-z]/ 表示只要包含小写字母都返回true
字符组合:/[a-zA-Z]/ 表示只要包含字母(大小写)都返回true
[^] 中括号里的“”表示取反的意思,注意与边界符的“”区分
量词符
量词符用来设定某个模式出现的次数
量词符 | 说明 |
---|---|
* | 重复0次或更多次 |
+ | 重复1次或更多次 |
? | 重复0次或1次 |
{n} | 重复n次 |
{n,} | 重复n次或更多次 |
{n,m} | 重复n到m次 |
预定义类
预定义类是指某些常见模式的简写方式
预定类 | 说明 |
---|---|
\d | 匹配0-9之间任一数字,相当于[0-9] |
\D | 匹配所有0-9以外的字符,相当于[^0-9] |
\w | 匹配任意的字母、数字和下划线,相当于[A-Za-z0-9] |
\W | 除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9] |
\s | 匹配空格(包括换行符、制表符、空格符等),相当于[\t\r\n\v\f] |
\S匹配非空格的字符,相当于[^\t\r\n\v\f]
正则表达式的替换
replace()方法可以实现替换字符串操作,用来替换的参数可以是一个字符串或是一个正则表达式
str.replace(regexp/substr,replacement)
- 第一个参数:被替换的字符串或正则表达式
- 第二个参数:替换为的字符串
- 返回值是一个替换后的新字符串
/表达式/[switch]
switch(也称为修饰符),有三种值
- g:全局匹配
- i:忽略大小写
- gi:全局匹配+忽略大小写