由于正则表达式通常包含反斜杠等特殊字符,所以我们最好使用原始字符串来表示他们。
什么是原始字符串?
Python正则表达式前的 r 表示原生字符串,该字符串声明了引号中的内容表示该内容的原始含义,避免了多次转义造成的反斜杠困扰。
(1)
>>> import re
>>> re.match('\d',"3")
<_sre.SRE_Match object; span=(0, 1), match='3'>
>>> re.match(r'\d',"3")
<_sre.SRE_Match object; span=(0, 1), match='3'>
(2)\不转意
>>> re.match(r'\\d',"3")
>>> re.match('\\d',"3")
<_sre.SRE_Match object; span=(0, 1), match='3'>
(3)
>>> re.match(r'\',"3")
File "<stdin>", line 1
re.match(r'\',"3")
^
SyntaxError: EOL while scanning string literal
>>> re.match(r'\\',"\\")
<_sre.SRE_Match object; span=(0, 1), match='\\'>
(4)
>>> print("\")
File "<stdin>", line 1
print("\")
^
SyntaxError: EOL while scanning string literal
>>> print("\\")
\
(5)
>>> re.match('\\\\',"\\")
<_sre.SRE_Match object; span=(0, 1), match='\\'>
>>> re.match(r"abc","abcdefg")
<_sre.SRE_Match object; span=(0, 3), match='abc'>