python中re.sub的使用 正则表达式

在python中,re就是regular expression的缩写,代表正则表达式,import re

sub是sunstitute的缩写,代表替换

 re.sub(r'([^\s\w]|_|[0-9])+','',text_string)  
首先
[^...] 不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。
这是个坑, ^匹配的是开始的地方,但是加了中括号就不一样了。\s\w就是说空白字符和非字母数字

这个正则表达式的意思就是去除数字,_和非字母的符号


import re
text_string = re.sub(r'([^\s\w]|_|[0-9])+',''," I 3   _ I  3 ? _ love you")
print (text_string)


结果:

F:\Users\zhangzhen\Anaconda3\python.exe F:/Users/zhangzhen/PycharmProjects/人机大战/test/cidai.py
 I     I     love you

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值