Python生成漂亮的词云,云的形状由你定

Python生成漂亮的词云,云的形状由你定

 

 

前言

在大数据时代,你竟然会在网上看到的词云,例如这样的。

看到之后你是什么感觉?想不想自己做一个?

如果你的答案是正确的,那就不要拖延了,现在我们就开始,做一个词云分析图,Python是一个当下很流行的编程语言,你不仅可以用它做数据分析和可视化,还能用来做网站、爬取数据、做数学题、写脚本替你偷懒……

如果你之前没有编程基础,没关系。希望你不要限于浏览,而是亲自动手尝试一番。到完成的那一步,你不仅可以做出第一张词云图,而且这还将是你的第一个有用的编程作品。

安装 wordcloud库

请确保你的python环境没有问题,我用的开发工具是VsCode,首先你要在Python扩展中安装python开发环境(当然,这不是为你的windows安装python)

Python生成漂亮的词云,云的形状由你定

 

 

那么你还需要安装所需要的第三方库,那么在VSCode中并没有PyCharm那么专业,这里需要获得你自己的Python脚本位置。

Python生成漂亮的词云,云的形状由你定

 

 

我们可以发现里面有一个名为pip.exe文件,这个文件就是python官方给我们去安装python第三方库的一个程序,那么我们可以在VsCode的终端中就可以去通过它,这也是我们为什么要获取python安装位置的根本原因。

例如我们安装WordCloud,我们的操作如下:

pip nstall WordCloud

数据

这个时候我们就要开始Code了,我们一定需要数据,这里我自己找了一个绕口令,内容如下:

Betty Botter bought some butter but she said the butter's bitter. If I put it in my batter it will make my batter bitter. So, she bought some better butter, better than the bitter butter and she put it in her batter and her batter was not bitter. So 'twas good that Betty Botter bought some better butter.

翻译: 贝蒂·波特买牛油, 可她说:“牛油是苦的。 不过加上一点好牛油—— 可以使苦牛油更好点。” 于是她买了一点牛油, 比苦牛油好点的牛油。 掺了之后苦牛油真的变的好多了。 所以这就是贝蒂·波特买的一点比苦牛油好点的牛油。

我把其中的文字存储成了一个文本,叫做minister.txt。

Code

python做词云呢,需要导入的包有wordcloud和PIL,其中PIL(Python Image Library)是python平台图像处理标准库,功能是真的强大。首先需要读取文件 。

首先我们要读取我们的txt文件,那么代码如下:

Python生成漂亮的词云,云的形状由你定

 

运行脚本结果如下:

Python生成漂亮的词云,云的形状由你定

 

 

接下来导包,我们看看如何生成最简单的词云:

Python生成漂亮的词云,云的形状由你定

 

 

如果python引入无误,并代码无误,那么会弹出你生成的图片,该图片会储存在你的系统。详细位置一般为: C:UsersMACHENIKEAppDataLocalTemp 中。

Python生成漂亮的词云,云的形状由你定

 

 

带形状的词云

一般来说,我们不想要这么方的词云,肯定喜欢一些有形状的,

接下来是生成那种有轮廓的词云,这里就需要继续导入其他包,这里导入的包为numpy,numpy系统是python的一种开源的数值计算扩展,这种工具可以用来存储和处理大型矩阵。这里在处理的时候将给出形状的图片表示为一个大型矩阵,再有颜色的地方来进行填词(导包 :import numpy as np)。导包之后需添加一个遮罩层,遮罩层就是用来限制生成图片的形状 。

网上随便找个图片放入到项目当中(这里我找的是一个:heartpulse:),然后开始code:

Python生成漂亮的词云,云的形状由你定

 

 

结果如下:

Python生成漂亮的词云,云的形状由你定

 

不支持中文的解决方案

我又从网上摘抄了一段文字,文字内容如下:

生活星期天早上和朋友一起聊天,朋友说了一个他们听过的故事:“一尊佛像前有一条铺着石板的路,人们每天都踏着这一阶一阶的石板去膜拜佛像。石阶看着人们踏着自己去膜拜佛像,心里很不舒服。石阶心里想,自己和佛本来就来自同一块石头,为什么自己要成为踏脚石,让人们踩着自去去膜拜它呢!它对佛抱怨说这样太不公平!佛像说:这没有什么不公平,你们成为台阶只需挨了四刀,而我是挨了千刀万剐才成了人们膜拜的佛像。

重新运行,发现雪崩了。

Python生成漂亮的词云,云的形状由你定

 

如果需要生成中文的词云,还需导入jieba分词的包。jieba分词的切分还是蛮准的。

Python生成漂亮的词云,云的形状由你定

 

Python生成漂亮的词云,云的形状由你定

 

C盘中有font字体,那么这些呢你可以自己去找,trans_CN方法是分词用的,通过font-path就可以指定里面的生成文本。这大概就是词云的基础了,可以将爬虫和词云生成结合在一起,在爬取信息之后生成这样的词云。

  • 9
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 生成关键词词云图需要使用Python中的第三方库wordcloud和jieba。首先需要安装这两个库,可以使用以下命令进行安装: ``` pip install wordcloud pip install jieba ``` 接下来,我们可以使用如下代码生成关键词词云图: ```python import jieba from wordcloud import WordCloud, STOPWORDS import matplotlib.pyplot as plt # 读取文本文件 with open('text.txt', 'r', encoding='utf-8') as f: text = f.read() # 分词处理 words = jieba.cut(text) words = ' '.join(words) # 去除停用词 stopwords = set(STOPWORDS) stopwords.add('的') stopwords.add('了') stopwords.add('是') # 生成词云图 wc = WordCloud( background_color='white', # 背景颜色 stopwords=stopwords, # 停用词 max_words=200, # 最多显示词数 font_path='msyh.ttc', # 字体文件路径 margin=5 # 边距 ).generate(words) # 显示词云图 plt.imshow(wc, interpolation='bilinear') plt.axis('off') plt.show() # 保存词云图 wc.to_file('wordcloud.png') ``` 其中,`text.txt`是待处理的文本文件,需要将其放在与代码同一目录下。在生成词云图时,我们使用了中文分词工具jieba对文本进行分词,并去除了一些常见停用词。此外,我们还可以设置词云图的一些参数,如背景颜色、最多显示词数、字体文件路径等。最后,使用`imshow`函数将词云图显示出来,并使用`to_file`函数将其保存到本地。 ### 回答2: Python生成关键词词云图的过程主要包括以下步骤: 1. 数据准备:首先需要准备要生成词云图的数据,可以是一段文本、文章、网页内容等。例如,我们可以使用Python的`requests`库爬取网页内容,或者读取本地文件。 2. 文本处理:将获取到的文本进行处理,去除无意义的词语、标点符号、停用词等。可以使用Python的`jieba`库进行分词,`nltk`库进行停用词的过滤。 3. 关键词提取:根据处理后的文本, 使用Python的`TF-IDF`算法或者`TextRank`算法提取关键词。可以使用`gensim`库或`textrank4zh`库等。 4. 生成词云图:根据提取到的关键词,使用Python的`wordcloud`库生成词云图。可以设置词云形状、背景颜色、字体样式、词语大小等。 5. 显示词云图:最后可以使用Python的`matplotlib`库或者`pyplot`库将生成词云图进行显示和保存。 下面是一个简单的示例代码: ```python import requests import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt # 获取文本数据 url = 'http://example.com' response = requests.get(url) text = response.text # 文本处理 # 去除停用词,可以自行准备停用词表 stopwords = ['的', '了', '是', '我', '你'] seg_list = jieba.cut(text) seg_list = [word for word in seg_list if word not in stopwords] # 关键词提取 keywords = ' '.join(seg_list) # 将分好的词连接成字符串 # 生成词云图 wordcloud = WordCloud().generate(keywords) # 显示词云图 plt.imshow(wordcloud, interpolation='bilinear') plt.axis('off') plt.show() ``` 通过上述步骤,我们可以使用Python生成关键词词云图。当然,具体的实现方式还可以根据自己的需求进行调整和优化。 ### 回答3: 生成关键词词云图是利用Python中的一些库和模块来实现的。首先,我们需要安装和导入一些相关的库,比如jieba用于中文分词,wordcloud用于生成词云图,matplotlib用于显示词云图。 具体操作步骤如下: 1. 安装所需库:在命令行中输入以下命令安装所需库。 ``` pip install jieba pip install wordcloud pip install matplotlib ``` 2. 导入所需库:在Python脚本中导入所需库。 ```python import jieba from wordcloud import WordCloud import matplotlib.pyplot as plt ``` 3. 准备文本数据:将需要生成词云图的文本保存在一个字符串中。 ```python text = "我爱中国,我喜欢学习编程,Python是一门很有用的编程语言。" ``` 4. 中文分词:使用jieba库对文本进行中文分词。 ```python words = jieba.lcut(text) ``` 5. 统计词频:统计每个词出现的次数。 ```python word_counts = {} for word in words: if len(word) > 1: # 过滤掉单个字符 word_counts[word] = word_counts.get(word, 0) + 1 ``` 6. 生成词云图:使用WordCloud库生成词云图。 ```python wordcloud = WordCloud(font_path="SimHei.ttf", width=800, height=400).generate_from_frequencies(word_counts) ``` 7. 显示词云图:使用matplotlib库显示生成词云图。 ```python plt.imshow(wordcloud, interpolation='bilinear') plt.axis("off") plt.show() ``` 以上就是用Python生成关键词词云图的基本步骤,通过逐步操作可以得到一个简单的关键词词云图。当然,还可以根据自己的需求进行一些参数调整,如字体、颜色、形状等,以生成更加个性化的词云图。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值