摘要
本文主要介绍了什么是正则表达式、如何去学习正则,然后简单介绍了元字符的种类。
目录
1.正则表达式
1.1 正则的定义
正则,就是正则表达式,英文是 Regular Expression
,简称 RE。顾名思义,正则其实就是一种描述文本内容组成规律的表示方式。
在编程语言中,正则常常用来简化文本处理的逻辑;在 Linux 命令中,可以帮助我们轻松地查找或编辑文件的内容。
1.2正则的功能
- 校验数据的有效性,比如验证手机号的位数以及无效的场景;
- 查找符合要求的文本,比如查找符合某些要求的手机号;
- 对文本进行切割、替换等操作,比如替换一段文本中同一个单词。
2.正则的学习
2.1 使用正则
- 分解问题:拿到问题后考虑分解成子问题以及每个子问题是否独立;
- 分析子问题:分析每个子问题的解决逻辑;
- 应用正则表示:使用正则表达式解释每个子问题的逻辑;
- 调试。
2.2 注意事项
- 能用普通字符串处理的,坚决⽤普通字符串处理。
- 能写注释的正则表达式,⼀定要写注释。
- 能用多个简单正则表达式解决的,⼀定不要苛求用一个复杂的正则表达式。
3. 元字符
元字符就是指那些在正则表达式中具有特殊意义的专用字符。
3.1 元字符的种类及含义
- 特殊单字符
.
表示任意字符(换行除外)\d
表示任意单个数字 ,\D
任意非数字\w
表示任意单个数字或字母或下划线 ,\W
表示非数字、字母、下划线\s
表示任意单个空白符,\S
表示任意非空白符
- 空白符
\r
回车符\n
换行符\f
换页符\t
制表符(TAB)\v
垂直制表符\s
任意空白符
- 范围
|
或,a|b 表示 a 或 b[...]
多选一,括号中的任意单个字符[a-z]
a 到 z 中的任意一个字符[^...]
不包含括号中的任意一个字符
- 量词
*
表示 0 到多次+
表示 1 到多次?
表示 0 到 1 次(可以表示是否存在){m}
表示出现 m 次{m,}
表示至少出现 m 次{m,n}
表示出现 m 到 n 次
- 断言
版权声明
本文原创作者:ereson
博客地址 :https://ereson.github.io/