python 模块re

正则表达式常用于字符串操作。
字符匹配:大多数字母和字符一般都会和自身匹配,也有例外。
元字符有.^$*+?{[]|()
首先考虑元字符[]他们常用来指定一个字符类别,就是你想匹配的一个字符集。字符可以的那个列出也可以用‘—’分隔两个给定字符来表示一个字符区间。例如[abc]表示匹配a,b,c中的任何一个,也可以用[a—c]来表示。可以用补集来匹配不在区间范围内的字符。[^5]会匹配除5以外的字符。‘\’反斜杠后面可以家不同的字符来表示不同的特殊含义,也可以用来取消所有的元字符,这样就可以在任意模式下匹配他们了,例如,你需要匹配字符‘[’或者‘\’你可以在他们之前添加反斜杠来取消他们的特殊意义,[或者\。
\d 匹配任意十进制数,相当于类[0-9]
\D 匹配任意非数字字符,相当于类[^0-9]
\s 匹配任意空白字符,相当于类[\t\n\r\f\v]
\S 匹配任意非空白字符,相当于类[^\t\n\r\f\v]
\w 匹配任意字母数字字符,相当于类[a—zA_Z0—9]
\W 匹配任意非字母数字字符,相当于类[^a—zA_Z0—9]
重复,正则表达式第一个能做的事就是匹配不定长的字符集,元字符 * 可以实现这个功能,他指定前一个字符匹配零次或者更多次,例如,ca*t,匹配ct,cat,caat…等。+匹配一次或者更多次,?匹配零次或者一次。

使用正则表达式,正则表达式被编译成‘RegexObject‘实例,可以为不同的操作提供方法。这里写图片描述
RegexObject实例有一些方法和属性这里写图片描述如果没有匹配到的话,match()和search()将返回None,如果成功的话,就会返回一个MatchObject实例,其中有这次匹配的信息,从哪里开始和结束,所匹配的子串等等。这里写图片描述
re.split()用pattern来拆分string,如果pattern含有括号,那么在pattern中所有的组也会被返回。如果匹配的字符串的开始,那么返回的结果将会以一个空串开始。
这里写图片描述
可以直接使用,也可以编译完再运行。
这里写图片描述

展开阅读全文

没有更多推荐了,返回首页