python模块之词云详细讲解!

1,前言

大家有没有在日常生活中接触过词语,提取一篇文章,进行分析、处理。可以更可观的了解这篇文章。怎么说,说不清。康康我的学习笔记吧。

2,正题部分

1,Wordcloud库基本介绍

wordcloud是优秀的词云展示第三方库。
词云以词语展示为单位,更加直观艺术的展示文本。

可以看出这是第三方库,需要安装。
在这里插入图片描述
啦啦啦,百度一下,你就知道,这就是他的效果。是不是富有艺术气息

怎么用呢?

很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:797403929

2, wordcloud库的安装

打开cmd命令行,输入:

pip install wordcloud

3,Wordcloud库使用说明

安装上了,怎么使用呢?

wordcloud库把词云当作Wordcloud对象。
Wordcloud.Wordcloud()代表一个文本对应的对象
可以根据文本中词语出现的频率等参数绘制词云。
词云的绘制形状、尺寸、颜色多可以设定。

前两句我可能没有明白吗,后两句想必大家都知道了,例如一篇文章中,“喜欢”一词出现的频率最多,那么,他展示的大。展示的词云样式是可以自定义的,

4,wordcloud库常规方法

w = wordcloud.wordcloud()

以Wordcloud对象为基础,
配置参数、加载文本、输出文本

在这里插入图片描述
所以目前这三句语句就可以绘制出一个词云

import wordcloud
w = wordcloud.wordcloud()
w.generate(txt)
w.to_file(pywordcloud.jpg)

那么,文本到词云在转换的过程中是怎么一回事呢

分隔:以空格分隔单词。
统计:单词出现次数并过滤。
字体:根据统计配置字号
布局:颜色环境尺寸。

4,配置对象参数

w = wordcloud.wordcloud(<参数>)

看来不要小看这个参数,里面包含了好多。。。类似main()
在这里插入图片描述
把这些参数直接往里面套:

w = wordcloud.wordcloud(width=100,heigh=50\
                       font_path=msyh.tcc)

总结

写完这些,对这些内容又熟悉了一遍。词云的用处还是很广的。小则分析一段文字,大则分析一些重要文件。通过图片更直观的了解一些内容。在这个视频流的时代,应该没有人喜欢看大段文字,反而是视频,图片。如果这样,清晰明了。
这就是以上内容,我的笔记。
谢谢您的,文章有错误,欢迎你的指正;如果对您有帮助,是我的荣幸。

在这里推荐下我的Python开发学习群:797403929,群里都是学Python开发的,如果你想学或者正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份最新的Python进阶资料和高级开发教程,欢迎进阶中和进想深入Python的小伙伴!

免责声明:本文内容来源于网络,文章版权归原作者所有,意在传播相关技术知识&行业趋势,供大家学习交流,若涉及作品版权问题,请联系删除或授权事宜。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python三国演义词云图实验过程如下: 1. 安装必要的库 首先需要安装必要的库,包括 jieba、wordcloud 和 matplotlib。可以使用 pip 或者 conda 命令进行安装。 ```python !pip install jieba !pip install wordcloud !pip install matplotlib ``` 2. 数据预处理 将《三国演义》文本文件读取进来,并进行分词处理。这里使用 jieba 库进行文分词。 ```python import jieba # 读取文本文件 with open('sanguo.txt', 'r', encoding='utf-8') as f: text = f.read() # 分词处理 words = jieba.cut(text) ``` 3. 生成词频统计 使用 Python 的 Counter 类统计每个词出现的次数,并生成词频统计结果。 ```python from collections import Counter # 统计词频 word_counts = Counter(words) # 获取前 100 个高频词 top_words = word_counts.most_common(100) ``` 4. 生成词云图 使用 wordcloud 库生成词云图,可以设置词云图的形状、颜色、字体等参数。 ```python from wordcloud import WordCloud import matplotlib.pyplot as plt # 生成词云图 wordcloud = WordCloud(width=800, height=400, background_color='white', font_path='msyh.ttc').generate_from_frequencies(word_counts) # 显示词云图 plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.show() ``` 完整代码如下: ```python import jieba from collections import Counter from wordcloud import WordCloud import matplotlib.pyplot as plt # 读取文本文件 with open('sanguo.txt', 'r', encoding='utf-8') as f: text = f.read() # 分词处理 words = jieba.cut(text) # 统计词频 word_counts = Counter(words) # 获取前 100 个高频词 top_words = word_counts.most_common(100) # 生成词云图 wordcloud = WordCloud(width=800, height=400, background_color='white', font_path='msyh.ttc').generate_from_frequencies(word_counts) # 显示词云图 plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.show() ``` 需要注意的是,生成词云图的效果与参数设置有很大关系,需要根据实际需求进行调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值