本人正在学习信息检索相关课程,想在这里发布学习笔记以供自己未来查阅,其中的内容有自己的理解已经查阅资料得出来的结论,如有错误欢迎批评指正。
前言
提示:以下是本篇文章正文内容,使用的是Jupyter Notebook,下面用到的资源会在结尾分享。
一、词云是什么?
词云就是将文本中出现频率高的关键词进行提取,将其放大并且进行颜色上的渲染以凸显其重要性。
二、英文词云
1.安装包
代码如下(示例):
pip install worldcloud
2.读取英文文本
建立一个TXT文件来存放要生成词云的英文文本,文件存放时要注意编码格式(选取UTF-8)。
我这选取的是《经济学人》中的一篇文章。
下面就要开始读取文件中的数据了。
代码如下(示例):
filename=r"C:\Users\de'l'l\Desktop\学习\信息检索与原理\词云\Economics.txt"#文本位置
with open(filename,encoding="utf-8")