python中文怎么通过jieba分词计算数量_【python】利用jieba中文分词进行词频统计...

最新推荐文章于 2023-08-25 10:10:21 发布

weixin_39720662

最新推荐文章于 2023-08-25 10:10:21 发布

阅读量1.4k

点赞数 1

文章标签： python中文怎么通过jieba分词计算数量

以下代码对鲁迅的《祝福》进行了词频统计:import ioimport jiebatxt = io.open("zhufu.txt", "r", encoding='utf-8').read()words = jieba.lcut(txt)counts = {}for word in words:if len(word) == 1:continueelse:counts[word] = coun...

摘要由CSDN通过智能技术生成

以下代码对鲁迅的《祝福》进行了词频统计:

import io

import jieba

txt = io.open("zhufu.txt", "r", encoding='utf-8').read()

words = jieba.lcut(txt)

counts = {}

for word in words:

if len(word) == 1:

continue

else:

counts[word] = counts.get(word,0) + 1

items = list(counts.items())

items.sort(key=lambda x:x[1], reverse=True)

for i in range(15):

word, count = items[i]

print (u"{0:<10}{1:>5}".format(word, count))

结果如下：

L3Byb3h5L2h0dHBzL2ltZzIwMjAuY25ibG9ncy5jb20vYmxvZy8xOTY2NzAzLzIwMjAwNC8xOTY2NzAzLTIwMjAwNDE1MTA1MjI5MTY4LTIxMzk1MTcxMTEucG5n.jpg

并把它生成词云

from wordcloud import WordCloud

import PIL.Image as image

import numpy as np

import j

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39720662

关注关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
python中文怎么通过jieba分词计算数量_【python】利用jieba中文分词进行词频统计...

以下代码对鲁迅的《祝福》进行了词频统计:import ioimport jiebatxt = io.open("zhufu.txt", "r", encoding='utf-8').read()words = jieba.lcut(txt)counts = {}for word in words:if len(word) == 1:continueelse:counts[word] = coun...
复制链接

扫一扫