Python正则表达式指南-CSDN博客

这个模块跟PERL的正则表达比较类似。在PYTHON中无论是正则表达示还是字符串都可以用UNICODE或者8位字符串进行搜索。

在本模块中用'r'进行原始字符的匹配，如字符串"abcd/na"，如果要把转义字符也匹配进去，在不用"r"是会像这样，"abcd//na"，

如果用'r'，则是r'abcd/na'就可以了。

一、正则表达式语法

正则表达式可以包括普通或特殊字符。如“｜”，“（”等就是特殊字符。不过它不能直接包括空字节，但可以用/number,比如'/x00'（没试成功）

>>> import string,re

>>> keys=string.ascii_letters+' ab'
>>> print keys

abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ ab

>>> if re.findall(r'',keys):
print 'ok'

常用语法图如下：

符号	匹配
. (dot)	默认情况下，任意单一字符（不包括换行）。特殊情况下包括换行符
/d	任意一位数字
[A-Z]	A 到 Z中任意一个字符（大写）
[a-z]	a 到 z中任意一个字符（小写）
[A-Za-z]	a 到 z中任意一个字符（不区分大小写）
+ []	匹配一个或更多 (例如, /d+ 匹配一个或多个数字字符) [abc]匹配'a','b','c'，[a-zA-Z]匹配所有字符，[^a-z]匹配非a-z,[z^z]匹配a^z
[^/]+ $	一个或多个不为‘/’的字符或者标记字符串开始标记字符串结束
？	零个或一个之前的表达式（例如：/d? 匹配零个或一个数字，ab?匹配'a'或'ab'）
* a{6} a{4,}	匹配0个或更多 (例如, /d* 匹配0个或更多数字字符) 只匹配6个a,而不是其它个数匹配前面有四个a 的字符串
{1,3} {m,n}? \|	介于一个和三个（包含）之前的表达式（例如，/d{1,3}匹配一个或两个或三个数字）如'aaaaaa'，a{3,5}匹配5个'a',a{3,5}?匹配3个字符 abc\|abd，匹配abc或者abd