一、概述
正则表达式使用反斜杠字符 (’’) 来表示特殊形式或是允许在使用特殊字符时不引发它们的特殊含义。
是对于正则表达式样式使用 Python 的原始字符串表示法;在带有 ‘r’ 前缀的字符串字面值中,反斜杠不必做任何特殊处理。
二、正则表达式语法
正则表达式可以包含普通或者特殊字符。绝大部分普通字符,比如 ‘A’, ‘a’, 或者 ‘0’,都是最简单的正则表达式。它们就匹配自身。
有些字符,比如 ‘|’ 或者 ‘(’,属于特殊字符。特殊字符既可以表示它的普通含义,也可以影响它旁边的正则表达式的解释。
重复修饰符 (*, +, ?, {m,n}, 等)不能直接嵌套。这样避免了非贪婪后缀 ? 修饰符和其他实现中的修饰符产生的多义性。要应用一个内层重复嵌套,可以使用括号。比如,表达式 (?:a{6})** 匹配 6 个 'a’字符重复任意次数。