最近发现,如果是匹配带有反斜杠的字符串的化,正则表达式前面加上r来去除转义,比较方便,比如:
a=’\ \ok’
b =re.match(r’\ \ok’,a)
a = ‘\nk’
b = re.match(r’\nk’,a)
这样就能正确匹配到了,如果前面不加r,则两个反斜杠要用四个反斜杠去匹配,很麻烦。
但是如果是匹配一些符号,比如冒号:,横杠-,下划线_, 包括逗号,分号等,直接写出来即可,前面不必加上r ; 还有\d,\D,\w,\W,\s等固定符号,它们本身就有自己的意思,直接使用就好,前面不必加r,当然,前面加r也没有错:
a=‘123abc’
b=re.match(’\d+’,a), 匹配到123
a=‘123abc’
b=re.match(r’\d+’,a) 同样匹配到123,没有影响
再比如:
a= ‘ok:;ok’
b = re.match(’\w+:;\w+’,a) 匹配到a全部
a=‘ok:;ok’
b = re.match(r’\w+:;\w+’,a) 同样匹配到a全部
因此可以看出,一般只有匹配带有反斜杠的字符串时,才会在前面加上r,并且要匹配什么就写什么就好(比如r" \ \ “, r”\n"等),对于其他不带反斜杠的字符串,他们的正则表达式正常写就好,不加r也可以。
但是一般保险起见,习惯性的加上r,也没错。
就是这样。