目录
一、安装词云库
1) pip install wordcloud #网络安装
2)python -m pip install 本地路径 #本地安装
二.应用词云库
生成步骤:
创建词云对象-->加载词云文本-->输出词云图片(文件)
(1)默认的矩形词云图片
(2)提供的图形词云图片
1.输出图片
1)导入wordcloud库模块
导入可以输出图片的模块PIL
2)创建词云对象时需注意wordcloud方法需大写W和C,wordcloud.WordCloud()
3)with open() as file: 打开文件,即开机关。
4)utf-8编码输出中英文。
2.读取输出遮罩图片
1)再多导入一个库读取遮罩图片(无坐标轴)
2)进阶版:导入一个数据可视化库里面一个基础图库pyplot(有坐标轴)
plt.imshow(wc)可以代替wc.to_file()和Image.open()这两步,它可以直接绘制词云图片并显示在当前二维列表中
三、jieba库介绍
jieba库是Python中一个重要的第三方中文分词函数库。
原理:利用一个中文词库,将待分词的内容和分词词库进行对比,通过图结构和动态规划方法找到最大概率的词组。jieba还提供自定义中文单词的功能。