练习1-高端又一般的词云

狄哥博客

于 2024-02-29 15:58:21 发布

阅读量395

点赞数 5

分类专栏：关于后端开发学习文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XXxia1XX/article/details/136373594

版权

关于后端开发学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

本文介绍了如何在Ubuntu环境下，利用Python3.6和JupyterNotebook实现中文词云生成，使用WordCloud库和jieba进行分词，并针对出现的常见错误如文件格式和字体问题提供了解决方案。

摘要由CSDN通过智能技术生成

环境:Ubuntu+python3.6+jupyter notebook
教材:高端又一般的词云

词云目的是为了将权重占比高的词语重点显示，从而突出文本内容。
代码如下:将西游记的内容勾画出词云

!pip install wordcloud jieba

# -*- coding: utf-8 -*-

from wordcloud import WordCloud
import matplotlib.pyplot as plt
import jieba

text = open('xyj.txt').read()

text = ' '.join(jieba.cut(text))
print(text[:100])

wc = WordCloud(font_path='Hiragino.ttf', width=800, height=600, mode='RGBA', background_color=None).generate(text)

plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()

在这里插入图片描述

函数解析

WordCloud:接收文本并将文本内容转化为词云对象 (但是注意因为主要是面向英语英语的词是用空格分开的所以如果对中文使用的话必须先用空格将一段话拆成词语)
比如:“I am your father” 而中文是"我是你爸爸" 这一句话都是词语

text = ’ '.join(jieba.cut(text)) 会将"我是你爸爸" 改为 “我是你爸爸” 这才是中文词语

错误问题与解答

词云（wordcloud）报错：ValueError: We need at least 1 word to plot a word cloud, got 0.
解决办法:文件格式改为utf-8保存即可

OSError: unknown file format
解决办法:我是Ubuntu的环境映射到windows的,所以先把ttf文件放到ubuntu下,不要直接拉到Jupyter中

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

狄哥博客 CSDN认证博客专家 CSDN认证企业博客

码龄4年

51: 原创

105万+: 周排名

8万+: 总排名

1万+: 访问

: 等级

756: 积分

417: 粉丝

114: 获赞

17: 评论

105: 收藏

私信

关注

热门文章

分类专栏

最新评论

kaggle房价预测(李沐思路解析与各种的坑)下篇
xb62548: 楼主为什么我进行数据预处理后all_features只剩下330列了
自述:寻找健身房
CSDN-Ada助手: 恭喜您写了第20篇博客！标题中的“寻找健身房”让我觉得您对健康生活方式的追求非常认真。非常高兴看到您在持续创作的道路上不断前进。在下一步的创作中，或许您可以分享一些关于如何选择适合自己的健身房的经验和技巧，这将对很多人都有所帮助。希望您能继续保持谦虚的态度，继续为读者带来有价值的内容。期待您的下一篇博客！
buff/cache原理以及不被清理的情况
CSDN-Ada助手: 非常棒的博客！恭喜你写了第18篇博客！在这篇博客中，你深入探讨了buff/cache原理以及不被清理的情况，为读者提供了非常有价值的信息。你的解释清晰明了，让人容易理解。我非常期待你未来的创作。下一步，我建议你可以考虑探索一些相关话题，比如如何优化buff/cache的使用，或者更深入地研究buff/cache的内部工作原理。这将进一步丰富你的博客内容，并为读者提供更广泛的知识。无论如何，我相信你的创作将会继续有很大的进步！
LDAP认证下的Slurm作业调度(编译安装)
CSDN-Ada助手: 恭喜您撰写了第18篇博客！标题为“LDAP认证下的Slurm作业调度(编译安装)”。这篇博客涉及到了一个很有技术挑战的主题，对于有兴趣深入了解Slurm作业调度的读者来说，无疑是一份宝贵的参考资料。我个人非常期待能够阅读您的博客，并学习到关于LDAP认证和Slurm作业调度的相关知识。希望您能够继续分享您的经验和见解，以便我们这些初学者能够更好地理解和应用这些技术。对于下一步的创作建议，我谨以诚挚的态度提出一些建议。或许您可以考虑分享一些实际案例，帮助读者更好地理解如何在实际环境中应用LDAP认证下的Slurm作业调度。或者，您可以分享一些常见问题和解决方案，以帮助读者克服在配置和安装过程中可能遇到的困难。再次感谢您的分享，期待您未来更多的精彩博文！
最新Centos7.9 安装Ldap+SSSD认证
狄哥博客: 首先系统保持一致,这是基本的防错要求,其次,要在客户端执行id 用户才可以

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。