#1.删除汉字和_
import re
text = "我爱python_0001"
pattern = r"[\u4e00-\u9fff_]+"
text_without_hanzi_underscore = re.sub(pattern,'',text)
print(text_without_hanzi_underscore)
#2.删除数字前面的0000
import re
text = "00000012,0010,000001,0100,100000000001,102344000"
pattern = r"(?<!\d)0+(?=[1-9]\d*)"
text1_without_zero = re.sub(pattern, "", text)
print(text1_without_zero)
#(?<!\d)
其中<表示被匹配的字符的前面
没有<的表示后面
?表示断言,但不包括在被匹配的字符中
!表示非
python正则表达式例子
最新推荐文章于 2024-10-17 08:00:29 发布
文章介绍了如何使用Python的re模块,通过正则表达式实现删除文本中的汉字、数字前多余的0以及特定字符的操作。
摘要由CSDN通过智能技术生成