import re
input = '自然语言处理很重要12abc789'
pattern = re.compile(r'.')#点.符号匹配匹配任意除换行符'\n'外的字符
re.findall(pattern,input)
运行结果:
pattern = re.compile(r'[abc]')#在中括号中指定想要找出的内容
re.findall(pattern,input)
运行结果:
pattern = re.compile(r'[^a-zA-Z]')#找出所有的非字母
re.findall(pattern,input)
####或方法
####将两个规则并列起来,以“|”连接,表示只要满足其中之一就可以匹配
####[a-zA-Z]\[0-9]等价于[a-zA-Z0-9]
pattern = re.compile(r'[a-zA-Z]|[0-9]')#找出所有的非字母
re.findall(pattern,input)