python词性统计_python nltk 统计语料的词性标注分布

最新推荐文章于 2023-04-07 15:37:24 发布

无脸纸片人

最新推荐文章于 2023-04-07 15:37:24 发布

阅读量1k

点赞数 1

文章标签： python词性统计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32192627/article/details/114463131

版权

import nltk

sent='消息/n 源/g 新浪/nz 财经/n 称/v ，/w 针对/p 今日/t 有/v 媒体/n 平台/n 报道/v 央行/n 已经/d 发文/v 暂停/v 比特/q 币/g 交易/n 的/u 消息/n ，/w 接近/v 监管/vn 层/qv 人士/n 对/p 新浪/nz 财经/n 表示/v ，/w 央行/n 确实/ad 下发/v 文件/n ，/w 但/c 并非/v 叫/v 停/v 比特/q 币/g ，/w 而是/c 加强/v 比特/q 币/g 的/u 监管/vn 。/w ';

sTuple=[nltk.tag.str2tuple(t) for t in sent.split()] #根据文本中的空格进行切分，切分后每一项再转为tuple元组，结构为: ('消息', 'N')

wordsCount=len(sTuple) #统计词个数

print('总词数：',wordsCount)

plt=nltk.FreqDist(sTuple) #获取统计结果，结果的结构为：每一项后面的数字是该字与其词性组合的出现次数，除了第一项的FreqDist外，后面的结构正好符合字典类型

print('各词性标注统计结果：')

d=dict(plt) #把统计结果转为字典型，它会删掉不符合字典结构的第一项FreqDist，把后面的结果转存为字典型

for key in d.keys(): #遍历字典，每一类词性的总次数一目了然

print(key,d[key])

结果如下：

无脸纸片人

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python词性统计_python nltk 统计语料的词性标注分布

import nltksent='消息/n 源/g 新浪/nz 财经/n 称/v ，/w 针对/p 今日/t 有/v 媒体/n 平台/n 报道/v 央行/n 已经/d 发文/v 暂停/v 比特/q 币/g 交易/n 的/u 消息/n ，/w 接近/v 监管/vn 层/qv 人士/n 对/p 新浪/nz 财经/n 表示/v ，/w 央行/n 确实/ad 下发/v 文件/n ，/w 但/c 并非/v ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。