只要涉及到程序,正则表达式都是不可避免的,掌握了正则是真的可以节省很多时间,为了更好的理解并掌握正则,只能自己好好做笔记了,忘了可以随时翻一下,哈哈。
先贴个常用正则表达式符号与特殊字符表
存在性和频数匹配(*、+、?)
- 星号(*):将匹配其左边的正则表达式出现零次或者多次的情况;
- 加号(+):操作符将匹配一次或者多次出现的正则表达式;
- 问号(?):操作符将匹配零次或者一次出现的正则表达式;
- 大括号({}):里面或者是单个值或者是一对由逗号分隔的值,将最终精确地匹配前面的正则表达式 N 次(如果是{N})或者一定范围的次数;
- 点号或句点(.):操作符将匹配除了换行符\n 以外的任何字符;
示例参考:
管道符号(|)匹配多个正则表达式
表示择一匹配的管道符号(|),也就是键盘上的竖线,表示一个“从多个模式中选择其 一”的操作。它用于分割不同的正则表达式。示例参考:
从字符串起始或者结尾或者单词边界匹配
- 脱字符(^):匹配字符串的开始位置;
- 美元符号($):匹配字符串的末尾位置;
示例参考:
特殊字符\b 和\B 可以用来匹配字符边界。而两者的区别在于\b 将用于匹配一个单词的边界,这意味着如果一个模式必须位于单词的起始部分,就不管该单词前面(单词位于字符串中间)是否有任何字符(单词位于行首)。同样,\B 将匹配出现在一个单词中间的模式(即不是单词边界)。示例参考:
创建字符集
某些时候,我们可能想要匹配某些特定字符,我们可以使用方括号([])符号,该正则表达式能够匹配一对方括号中包含的任何字符。示例参考:
除了单字符以外,字符集还支持匹配指定的字符范围。方括号中两个符号中间用连字符(-)连接,用于指定一个字符的范围;例如,A-Z、a-z 或者 0-9 分别用于表示大写字母、小写字母和数值数字。
如果脱字符(^)紧跟在左方括号后面,这个符号就表示不匹配给定字符集中的任何一个字符。示例参考:
使用圆括号指定分组
一对圆括号可以实现以下任意一个(或者两个)功能:
- 对正则表达式进行分组;
- 匹配子组。
为何想要对正则表达式进行分组的呢?当有两个不同的正则表达式,而且想用它们来比较同一个字符串时。另外,对正则表达式进行分组可以在整个正则表达式中使用重复操作符(而不是一个单独的字符或者字符集)。
使用圆括号进行分组的一个副作用就是,匹配模式的子字符串可以保存起来供后续使用。 这些子组能够被同一次的匹配或者搜索重复调用,或者提取出来用于后续处理。示例参考:
扩展表示法
扩展表示法,它们是以问号开始(?…)。它们通常用于在判断匹配之前提供标记,实现一个前视(或者后视)匹配,或者条件检查。示例参考: