原标题:自学Python笔记:打造我的第一个词云
两会词云
“词云”是对文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
作为教育工作者,可以利用词云工具,提供给阅读者整个信息的新重点,揭示关键概念并使用新的模式,以加强学习。词云有可能成为最新的计算机辅助学习的新形式。尤其在外语教学中适当地运用词云手段可以改善教学效果,提高教学质量,对培养学生多方面的能力和提高教师素质也有很多益处。
网上有很多的绘制词云工具,如果用Python绘制词云,主要用到的是wordcloud库。
安装很简单,只要在命令行模式下输入下面指令即可完成安装。
pip install wordcloud
wordcloud安装时如果你是Python3.6版本需要先安装Visual C++ 2017 redistributable packages,请提前安装好。
Visual C++ 2017
英文词云
从字面看就知道词云分析的对象是文本,是对文本数据的“关键词”进行提取分析,因为wordcloud对中文支持不好,我们先以英文文本为例。
今年国产电影战狼2够火,先到维基百科上找到了这部电影的词条“Wolf Warrior 2”。(精简了一下原文)
Wolf Warrior 2 is a 2017 Chinese action film

本文介绍了如何使用Python的wordcloud库创建词云,包括英文和中文文本的处理。通过示例展示了从安装库到自定义词云形状的步骤,强调了在处理中文时使用jieba分词库的重要性。
最低0.47元/天 解锁文章

798

被折叠的 条评论
为什么被折叠?



