python 将单词分割成字母_在python中,如何将文本文件拆分成单词?

这取决于你如何定义words,或者你认为什么是delimiters。

注意,Python中的string.split接收到一个可选参数delimiter,因此您可以这样传递它:for lines in content[0].split():

for word in lines.split(','):

print(word)

不幸的是,string.split只接收一个分隔符,因此您可能需要这样的多级拆分:for lines in content[0].split():

for split0 in lines.split(' '):

for split1 in split0.split(','):

for split2 in split1.split('.'):

for split3 in split2.split('?'):

for split4 in split3.split('!'):

for word in split4.split(':'):

if word != "":

print(word)

看起来很难看,对吧?幸运的是,我们可以使用迭代:delimiters = ['\n', ' ', ',', '.', '?', '!', ':', 'and_what_else_you_need']

words = content

for delimiter in delimiters:

new_words = []

for word in words:

new_words += word.split(delimiter)

words = new_words

编辑:

或者我们可以使用正则表达式包:import re

delimiters = ['\n', ' ', ',', '.', '?', '!', ':', 'and_what_else_you_need']

words = re.split('|'.join(delimiters), content)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值