python里split函数进行文本词语分割

# 汉语分词
text='我是一名五年级的小学生,我喜欢写程序。'
print(text.split())
CHwords=[]
for word in text.split(): 
    CHwords.extend(word)
print(CHwords)
# 英语分词
text='I am a chinese girl!!'
EGwords=[]
for word in text.split(): 
    EGwords.append(word)
print(EGwords)
# 英语简写分词
text='I\'m a chinese girl!!'
for char in '-.,;!\n"\'':             # 将标点符号用空格代替
    text=text.replace(char,' ')
print(text)
# ''的长度是0,因此将words中长度为0的删除。
newwords=[]
for word in text.split():  # 依据空格来进行词语分割
    if(len(word)!=0):
        # 对于字符变量append()和extend()功能不一样
        newwords.append(word)        
print(newwords)

程序运行结果:
['我是一名五年级的小学生,我喜欢写程序。']
['我', '是', '一', '名', '五', '年', '级', '的

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值