正则表达式中的反斜线(\即转义符)用来表示转义序列,或去掉元字符的转义。
元字符包括:. * ? + ^ $ | \,所以需要匹配元字符时需要加上反斜线\。
(windows系统中不支持的字符包括:/:?"<>|。所以可以采用正则表达式去除这些符号。)
\是转义字符,使得跟在他后边的单引号不与字符串的格式引号冲突
>>> 'doesn\'t'
"doesn't"
\t表示空四个字符,也称缩进,相当于一个Tab
>>>s = 'First line.\tSecond line'
>>>print(s)
First line. Second line
\n表示换行,相当于一个回车
>>> s = 'First line.\nSecond line'
>>> print(s)
First line.
Second line
r在字符串前:取消转义,使得字符串中的\用作普通字符
>>> print(r'C:\some\name')
C:\some\name
\s:用于匹配单个空格符,包括tab键和换行符;
\s+:用于匹配多个空格字符,包括且不仅限于\s的范畴
\S:用于匹配除单个空格符之外的所有字符;
\d:用于匹配从0到9的数字;
\w:用于匹配字母,数字或下划线字符;
\W:用于匹配所有与\w不匹配的字符;
. :用于匹配除换行符之外的所有字符。