python提取字符串中单词_从字符串中提取单词,删除标点符号并在Python中返回带有分隔单词的列表...

本文介绍如何在Python中使用正则表达式`w+`来提取字符串中的单词,忽略标点符号。提供了两个不同的函数实现,分别通过正则表达式`re.compile('w+').findall()`和通过字符串处理`''.join(c if c.isalnum() else ' ') for c in text`.split()`。示例展示了如何从包含标点符号和特殊字符的文本中提取单词列表。
摘要由CSDN通过智能技术生成

这与分裂和标点符号无关;你只关心字母(和数字),只想要一个正则表达式:

import re

def getWords(text)

return re.compile('\w+').findall(text)演示:

>>> re.compile('\w+').findall('Hello world, my name is...James the 2nd!')

['Hello', 'world', 'my', 'name', 'is', 'James', 'the', '2nd']如果您不关心数字,请将\w替换为[A-Za-z]仅用于字母,或将[A-Za-z']替换为包括收缩等。可能有更好的方法将字母非数字字符类(例如带有重音符号的字母)与其他正则表达式包括在内。

我几乎在这里回答了这个问题:Split Strings with Multiple Delimiters?

但是你的问题实际上没有说明:你想把'this is: an example'分成:

['this', 'is', 'an', 'example']

或['this', 'is', 'an', '', 'example']?

我认为这是第一个案例。

[this', 'is', 'an', example'] is what i want. is there a method without impo

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值