剖析正则表达式的本身其实是一个等价的概念,正则的字符都是等价字符,如果把等价都恢复成原始写法,那么正则的记忆就会很简单了。
? , * ,+ , \d , \w 这些都是基本的等价字符
? 等价于集合 匹配长度{0,1}
-
等价于匹配长度{0,}
-
等价于匹配长度{1,}
\d 等价于[0-9]
\w 等价于[A-Za-z0-9]
. [ ] ^ $ 这四个是所有语言都支持的正则表达式 是最基础的正则表达式
. 任何单个字符 (. 转义 字符点)
[] 包含,默认为一个字符长度
^ 开始
$ 结尾
在以上四个通用字符的基础上进行一定拓展
[^] 不包含, 默认是一个字符长度
[A-Z] 26个大写字母
[a-z] 26个小写字母
[0-9] 0至9 数字
[A-Za-z0-9] 26个大写字母、26个小写字母和0-9数字
() 域段
{n,m} 匹配长度
| 或
& 与
\ 转义
基础语法
“^([包含内容]{匹配长度}) ([]{}) ([]{})$”