使用jieba库对文件狐狸和乌鸦.txt 中的文本进行分词,并对每个词出现的次数进行统计，将词频最高的前三个词输出

最新推荐文章于 2021-12-04 20:30:27 发布

小bird

最新推荐文章于 2021-12-04 20:30:27 发布

阅读量2.7k

点赞数 2

分类专栏： python

本文链接：https://blog.csdn.net/weixin_42241770/article/details/106504487

版权

python 专栏收录该内容

80 篇文章 294 订阅

订阅专栏

1.使用jieba库对文件狐狸和乌鸦.txt 中的文本进行分词,并对每个词出现的次数进行统计，
将词频最高的前三个词输出
【提示】直接对分词结果进行统计时，标点符号及一些无意义的词语（如“了”“的”等）也会参与统计。
因此，在统计时需要将这些词语踢出。踢出的方法如下：
（1）可创建停用次列表，统计时判断词语是否在停用词列表中。
（2）统计时可对词语的长度进行限制。如剔除长度为1的词语

请在【python数据分析之禅】gzh后台，回复‘作业’获取答案