生成词云图

最新推荐文章于 2024-04-22 14:24:30 发布

网工欧昆

最新推荐文章于 2024-04-22 14:24:30 发布

阅读量3k

点赞数

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ouyangxikun/article/details/122018656

版权

python 专栏收录该内容

16 篇文章 2 订阅

订阅专栏

生成词云图

1.词云图原理：

主要针对文章的内容，统计各个词出现的次数，然后根据出现的次数，设置显示出什么样的样式，图中词的大小、颜色等等

2.关键方法及其参数：

格式：w=wordcloud.WordCloud(<参数>)

参数：

2.1)font_path:字体路径，默认不支持中文，可通过指定该参数指定字体，支持OTF和TIF格式；

2.2)width、height:画布的宽度和高度，以像素为单位

2.3)margin:指文字之间的边距

2.4)mask:指定图片的形状，通常为ndarray

2.5)max_words:指最多显示词的数量，默认为200

2.6)min_font_size、max_font_size:指最小/最大字体大小

2.7)font_step:指字体大小增加步长，默认为1

2.8)background_color:词云图的背景颜色，默认为黑色

2.9)generate(text):根据文本生成词云图，返回当前对象本身

2.10)to_image():将词云对象转化为图片

2.11)to_file(文件名):将词云对象转化为文件

2.12)to_array():将词云对象转化为数组

3.生成词云图步骤：

3.1)创建wordcloud对象，指定基本信息

3.2)调用generate()方法生成词云

3.3)保存或显示词云图

4.jiaba的应用：

（1）jieba的三中模式：

1.1）精确模式：把文本精确的切分开不存在冗余单词

1.2）全模式：把文本中所有可能的词语都扫描出来，但是有冗余

1.3）索搜引擎模式：在精确模式上，对长词再次切分

（2）jieba库常用函数：

2.1)jieba.cut(s):精确模式

2.2)jieba.cut(s,cut_all=True)：全模式

2.3)jieba.cut_for_search(s)：搜索模式

2.4)jieba.lcut(s)：精确模式，返回一个列表类型

2.5)jieba.lcut(s,cut_all=True)：全模式，返回一个列表类型

2.6)jieba.lcut_for_search(s)：搜素模式，返回一个列表类型

2.7)jieba.add_word(w)：向分词词典中增加新词w

1.

2.

3.

----这是由于python中的wordcloud不认识中文。

4.

5.

关注

0
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
生成词云图

生成词云图1.词云图原理：主要针对文章的内容，统计各个词出现的次数，然后根据出现的次数，设置显示出什么样的样式，图中词的大小、颜色等等2.关键方法及其参数：格式：w=wordcloud.WordCloud(<参数>) 参数： 2.1)font_path:字体路径，默认不支持中文，可通过指定该参数指定字体，支持OTF和TIF格式； 2.2)width、height:画布的宽度和高度，以像素为单位 2.3)ma...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。