正则表达式定义
正则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是一种强大而灵活的文本处理工具,用于文本的复杂处理,常用的应用场景如字符串的搜索,匹配,替换等。大部分的编程语言,脚本语言或文本编辑器都支持正则表达式,虽然在用法上有些许差异,但是语法规则都是类似的。学习正则表达式就是学习其语法规则,然后运用这些规则去匹配需求的字符串。
学习目的
由于正则表达式的强大而灵活的功能,在项目中会经常使用到,由于前后端程序分离开发,后端开发的接口不信任前端送过来的数据是正确的,后端需要数据校验,但是为了响应效率,无疑在前端做数据校验是必要的。所以通常前后端都做数据校验,数据校验通常是判空,判断数据格式之类的,后者就需要使用到正则表达式了。当然,这只是正则表达式用途之一,也可用于数据库SQL,linux文件中的vim操作、文件查找,所以学习正则表达式还是很有必要的。
正则表达式语法
语法规则比较多,只要求记住常用的就行,如果忘记可以查找相关资料。总体来说分为普通字符和元字符(特殊字符),细分为以下几类。
1. 普通字符
字母、数字、汉字、下划线以及没有特殊定义的标点符号,都是普通字符。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。
2. 简单的转义字符
表达式 | 作用 |
---|---|
\n | 代表换行符 |
\t | 制表符 |
\^ \$ \. \{ \+等 | 代表字符本身 |
3.标准字符集合
- 能和多种字符匹配
- 区分大小写,大写是相反意思
表达式 | 作用 |
---|---|
\d | 任意一个数字,0-9中任意一个 |
\w | 任意一个字母或数字或下划线也就是A-Z,a-z,0-9,_任意一个 |