python 识别汉字、数字、字母,实现半角及全角之间的转换

去除标点符号:

re.sub

text = "电影《2012》讲述了2012年12月21日的世界末日,主人公Jack以及世界各国人民挣扎求生的经历,灾难面前,尽现人间百态。"
print('原文:',text,sep= '\n', end = '\n')
print('去除标点符号:',re.sub("\W*",'',text),sep= '\n', end = '\n')

注:“\W” 匹配非字母数字及下划线

       "\w"匹配字母数字及下划线

详细内容见“正则匹配”

【python】使用正则匹配判断字符串中含有某些特定子串 及 正则表达式详解_小白想听人话的博客-CSDN博客_python匹配子串

去除标点符号的其他方法:识别文本中的汉字、字母、数字

PS:实现字符串的半角及全角之间的相互转换

def is_chine
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值