Python|字符串去除与保留部分内容(数字、中文、英文、标点、空格等)
去掉数字
去掉中文
去掉英文
去掉标点
同时去掉中英文标点
去掉中文标点
去掉英文标点
去掉空格
保留内容
整理使用Python去除字符串中的数字、中文、英文等,主要方法是使用基于正则化的re库。其他方法后面再补充进来~
去掉数字
\d \s \w分别表示数字,空格,数字和字母,\大写字母 则表示它们的补集,如:\S表示非数字
import re
case = "你好,world!123,,"
out = re.sub('[\d]', '', case) # [0-9]
print(out)
你好,world!,,
re.sub()方法用于替换字符串中的匹配项
[\d]是一个正则表达式,\d表示数字,也可直接用0-9,若去掉空格则用\s
''是要替换的内容,是空字符串,相当于把匹配到的内容删除掉
去掉中文
import re
case