python之Wordcloud库学习笔记

1,前言

大家有没有在日常生活中接触过词语,提取一篇文章,进行分析、处理。可以更可观的了解这篇文章。怎么说,说不清。康康我的学习笔记吧。

2,正题部分

1,Wordcloud库基本介绍

  • wordcloud是优秀的词云展示第三方库。
  • 词云以词语展示为单位,更加直观艺术的展示文本。

可以看出这是第三方库,需要安装。

词云效果

啦啦啦,百度一下,你就知道,这就是他的效果。是不是富有艺术气息

怎么用呢?

2, wordcloud库的安装

打开cmd命令行,输入:

pip install wordcloud

3,Wordcloud库使用说明

安装上了,怎么使用呢?

  • wordcloud库把词云当作Wordcloud对象。
  • Wordcloud.Wordcloud()代表一个文本对应的对象
  • 可以根据文本中词语出现的频率等参数绘制词云。
  • 词云的绘制形状、尺寸、颜色多可以设定。

前两句我可能没有明白吗,后两句想必大家都知道了,例如一篇文章中,“喜欢”一词出现的频率最多,那么,他展示的大。展示的词云样式是可以自定义的,

4,wordcloud库常规方法

w = wordcloud.wordcloud()
  • 以Wordcloud对象为基础,
  • 配置参数、加载文本、输出文本
方法描述
w.generate(txt)向Wordcloud对象w中加载文本txt
w.to_file(filename)将词云输出为图像文件,.png或.jpg格式

所以目前这三句语句就可以绘制出一个词云

import wordcloud
w = wordcloud.wordcloud()
w.generate(txt)
w.to_file(pywordcloud.jpg)

那么,文本到词云在转换的过程中是怎么一回事呢

  1. 分隔:以空格分隔单词。
  2. 统计:单词出现次数并过滤。
  3. 字体:根据统计配置字号
  4. 布局:颜色环境尺寸。

4,配置对象参数

w = wordcloud.wordcloud(<参数>)

看来不要小看这个参数,里面包含了好多。。。类似main()

参数描述
width指对词云对象生成图片的宽度,默认400像素。
height指对词云对象生成图片的高度,默认200像素。
min_font_size指定词云中字体的最小号,默认4号。
max_font_size指定词云中字体的最大号,根据高亮自动调节。
font_stop指定词云中字体字号的进步间隔,默认为1.
font_path指定字体文件路径,默认None。
max_words指定词云显示的最大单词数量,默认200.
stop_words指定词云的排除词列表,即不显示的单词列表。
mask指定词云形状,默认为长方形,需要引用imread()函数
background_ color指定词云图片的背景颜色,默认黑色。

把这些参数直接往里面套:

w = wordcloud.wordcloud(width=100,heigh=50\
                       font_path=msyh.tcc)

总结

写完这些,对这些内容又熟悉了一遍。词云的用处还是很广的。小则分析一段文字,大则分析一些重要文件。通过图片更直观的了解一些内容。在这个视频流的时代,应该没有人喜欢看大段文字,反而是视频,图片。如果这样,清晰明了。

这就是以上内容,我的笔记。

很广的。小则分析一段文字,大则分析一些重要文件。通过图片更直观的了解一些内容。在这个视频流的时代,应该没有人喜欢看大段文字,反而是视频,图片。如果这样,清晰明了。

这就是以上内容,我的笔记。

谢谢您的,文章有错误,欢迎你的指正;如果对您有帮助,是我的荣幸。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值