正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。
re 模块使 Python 语言拥有全部的正则表达式功能。re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。
re 模块使 Python 语言拥有全部的正则表达式功能。
compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。
re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。
正则表达式语法规则
模式字符串使用特殊的语法来表示一个正则表达式:
-
字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。
-
多数字母和数字前加一个反斜杠时会拥有不同的含义。
-
标点符号只有被转义时才匹配自身,否则它们表示特殊的含义。
-
反斜杠本身需要使用反斜杠转义。
-
由于正则表达式通常都包含反斜杠,所以最好使用原始字符串来表示它们。模式元素(如 r’\t’,等价于 ‘\t’)匹配相应的特殊字符。
下表列出了正则表达式模式语法中的特殊元素。如果你使用模式的同时提供了可选的标志参数,某些模式元素的含义会改变。
匹配单个字符
Python re模块中的语法规则如下:
1. 字符匹配:
- 字符:匹配自身字符
- .:匹配除换行符外的任意字符
- \d:匹配任意数字字符