在python中,re就是regular expression的缩写,代表正则表达式,import re
sub是sunstitute的缩写,代表替换
re.sub(r'([^\s\w]|_|[0-9])+','',text_string)首先
[^...] | 不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。 |
这个正则表达式的意思就是去除数字,_和非字母的符号
import re text_string = re.sub(r'([^\s\w]|_|[0-9])+',''," I 3 _ I 3 ? _ love you") print (text_string)
结果:
F:\Users\zhangzhen\Anaconda3\python.exe F:/Users/zhangzhen/PycharmProjects/人机大战/test/cidai.py
I I love you