NLTK学习一

#!user/bin/python

import nltk

text = 'I am a good boy. I love programming'
sens = nltk.sent_tokenize(text)
#print sens
words = []
for sent in sens:
    words.append(nltk.word_tokenize(sent))
#print words
tags = []
for word in words:
    tags.append(nltk.pos_tag(word))
print tags
<span style="font-size:18px;">
</span>

nltk.sent_tokenize(text) #对文本按照句子进行分割

nltk.word_tokenize(sent) #对句子进行分词

nltk.pos_tag(tokens)#tokens是句子分词后的结果,同样是句子级的标注
nltk.ne_chunk(tags)#tags是句子词性标注后的结果,同样是句子级

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值