Python学习(三)——正则表达式模块

正则表达式入门:

http://www.cnblogs.com/deerchao/archive/2006/08/24/zhengzhe30fengzhongjiaocheng.html

re.match

match从字符串的开头进行匹配(注意是开头!!!)

text = "wensishuai is a handsome boy, he is cool, clever, and so on..."
m = re.match(r'(w\w+)\s', text, re.I)
if m:  
    print m.groups() 
else:  
    print 'not match'
返回的match object函数

re.search

search不必从开头进行匹配

返回值与match相同

re.findall

re.findall可以获取字符串中所有匹配的字符串。

text = "wensishuai is a handsome boy, he is cool, clever, and so on..."
strlist = re.findall(r'\b(c\w+)\b', text, re.I)
#strlist=['cool', 'clever']

re.sub

字符串替换

text = "Wensishuai is a handsome boy, he is cool, clever, and so on..."  
newtext =  re.sub(r'\b(W\w*)\b', lambda m: '<' + m.group(0) + '>', text)
re.split

返回一个list

text = "Wensishuai     is a handsome boy, he is cool, clever, and so on..."  
strlst = re.split(r'\s+', text)

re.complie

可以把正则表达式编译成一个正则表达式对象。可以把那些经常使用的正则表达式编译成正则表达式对象,这样可以提高一定的效率。下面是一个正则表达式对象的一个例子:

text = "JGood is a handsome boy, he is cool, clever, and so on..."  
regex = re.compile(r'\w*oo\w*')  
print regex.findall(text)  
print regex.sub(lambda m: '[' + m.group(0) + ']', text) 




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值