Python-jieba 分词

最新推荐文章于 2024-07-19 16:36:18 发布

一箱哇哈哈

最新推荐文章于 2024-07-19 16:36:18 发布

阅读量395

点赞数 11

文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72543096/article/details/135280881

版权

题目要求：红楼梦相关的分词，出现次数最高的20个。

代码如下：

import jieba
from collections import Counter
import os

with open('hongloumeng.txt', 'r', encoding='utf-8') as file:
   text = file.read()

# 使用jieba进行分词
words = jieba.lcut(text)  # 使用lcut直接返回一个列表

# 统计词频
word_counts = Counter(words)

# 找出出现次数最高的20个词
top_twenty_words = word_counts.most_common(20)

# 打印结果
print("分词排序")
for word, freq in top_twenty_words:
    print(f'分词: {word}, 次数: {freq}')

运行结果：

一箱哇哈哈

关注

11
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
Python-jieba 分词

题目要求：红楼梦相关的分词，出现次数最高的20个。
复制链接

扫一扫

一箱哇哈哈 CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

135万+: 周排名

20万+: 总排名

1万+: 访问

: 等级

195: 积分

37: 粉丝

60: 获赞

11: 评论

46: 收藏

私信

关注

热门文章

最新评论

IDEA报错：无法自动装配。找不到 ‘xxxService‘ 类型的 Bean。【错误记录】
FindYou.: 谢谢楼主
Python比赛模拟
CSDN-Ada助手: “恭喜你能持续创作，第12篇博客“Python比赛模拟”内容丰富，让人受益匪浅。希望你能继续保持创作的热情，不断提升自己的写作水平。下一步建议可以尝试写一些实际项目的应用经验，或者是深入分析一些技术领域的前沿知识，相信会有更多人受益于你的分享。”
Python-jieba 分词
CSDN-Ada助手: 恭喜您写了第13篇博客！标题为“Python-jieba 分词”，我很高兴看到您在持续创作。阅读您的文章后，我对Python-jieba分词有了更深入的了解，感谢您的分享。在下一步的创作中，我建议您可以探索一下Python-jieba分词在文本处理、自然语言处理等领域的应用。通过深入研究，您可以进一步拓宽您的知识领域，并为读者提供更多有价值的内容。期待您未来更多的精彩博文！谢谢您的努力和分享。
Pygame小游戏制作
CSDN-Ada助手: 恭喜你写了第10篇博客，标题为“Pygame小游戏制作”！你的持续创作让人印象深刻，真的很棒！希望你可以继续分享关于Pygame小游戏制作的经验和技巧，也可以尝试写一些关于游戏设计或者游戏开发的深入文章，让读者可以更全面地了解这个领域。加油！期待你的下一篇作品！
Python爬虫作业
CSDN-Ada助手: 恭喜您完成了第11篇博客“Python爬虫作业”！您的持续创作让我们看到了您对于技术的热爱和执着。在下一步的创作中，或许可以尝试写一些关于爬虫技术的实战经验分享，或者是对于爬虫工具的比较和评测，这样会更加丰富您的博客内容。希望能够看到更多精彩的作品，加油！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。