去除字符串中的标点符号和特殊字符

最新推荐文章于 2024-06-13 09:50:09 发布

hhiiiiii

最新推荐文章于 2024-06-13 09:50:09 发布

阅读量832

点赞数

分类专栏： python 机器学习文章标签：自然语言处理 python

本文链接：https://blog.csdn.net/hhiiiiii/article/details/120565683

版权

python 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

机器学习

2 篇文章 0 订阅

订阅专栏

在进行中文文本分类时，文本中的标点符号和特殊字符对模型的训练是没有用的，需要去除，这里是利用ord()函数，ord()函数接收一个字符，返回字符的ASCII值，下面是示例代码（只能去除英文格式的标点符号）：

a='abc,2013年的一个新闻!,@#%   娱乐'

b=''

for i in a:

    if (ord(i)>=32 and ord(i)<=47) or (ord(i)>=58 and ord(i)<=64) or (ord(i)>=91 and ord(i)<=96) or (ord(i)>=123 and ord(i)<=126):

        continue

    else:

        b+=i

print(b)  #abc2013年的一个新闻娱乐

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hhiiiiii

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
去除字符串中的标点符号和特殊字符

在进行中文文本分类时，文本中的标点符号和特殊字符对模型的训练是没有用的，需要去除：a='abc,2013年的一个新闻!,@#% 娱乐'b=''for i in a: if (ord(i)>=32 and ord(i)<=47) or (ord(i)>=58 and ord(i)<=64) or (ord(i)>=91 and ord(i)<=96) or (ord(i)>=123 and ord(i)<=126):
复制链接

扫一扫