python词云词频分析_Python词云(词频统计,掩膜显示)

Python2.7 anaconda。安装Wordcloud,网上有许多下载路径,说一下掩模,就是在这个膜的区域才会有东西,当然这个与实际的掩模还有一定区别,这个词频显示是把所有统计的词,显示在这个掩模图片的非白色区域。

(接下来就不用看着网上那些小软件很羡慕,其实代码就十行左右,你也可以)

from os import path

from scipy.misc import imread

import matplotlib.pyplot as plt

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

# 获取当前文件路径

# __file__ 为当前文件, 在ide中运行此行会报错,可改为

# d = path.dirname('.')

d = path.dirname(__file__)

#

text = open(path.join(d, 't.txt')).read()

# 设置背景图片,也就是掩膜图像,在非白色部分我们的统计好的词频会显示在这里

alice_coloring = imread(path.join(d, "b.jpg"))

wc = WordCloud(background_color="white", #背景颜色

#max_words=2000,# 词云显示的最大词数

mask=alice_coloring,#设置背景图片

stopwords=STOPWORDS.add("said"),

max_font_size=60, #字体最大值

random_state=50)

#上述函数设计了词云格式

# 生成词云, 可以用generate输入全部文本(中文不好分词),也可以我们计算好词频后使用generate_from_frequencies函数

wc.generate(text)

#文本词频统计函数,本函数自动统计词的个数,以字典形式内部存储,在显示的时候词频大的,字体也大

# 从背景图片生成颜色值

image_colors = ImageColorGenerator(alice_coloring)

# 以下代码显示图片

plt.figure()

# recolor wordcloud and show

# we could also give color_func=image_colors directly in the constructor

plt.imshow(wc.recolor(color_func=image_colors))

plt.axis("off")

# 绘制背景图片为颜色的图片

411706-20170317191310073-1289086333.jpg

示例图像,文本分词是直接用的英文(网上随便粘贴一篇英文文章),它是以空格进行分词的。如果是中文也可以用网上推荐的分词器,或者你是做数据分析的,当然就知道怎么分词了。

411706-20170317191003932-220864791.png

bra................嘿嘿嘿

图片背景色为白色,分清图片背景,和掩模,和掩模背景色(函数默认的是白色区域)

411706-20170317191243198-1121791550.png

词频分析,数据分析挖掘。

以后再PPT中也可以用啦!!!!!!!!!!!!!!!!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python生成词云词频统计的方法可以通过以下几个步骤来实现。首先,你需要读取文件并将其内容存储在一个变量中。然后,你可以使用遍历来统计关键词的出现次数,并排除一些不需要统计的字符或词语。接下来,你可以使用词频统计的结果生成词云图。最后,你可以将词频统计词云图的结果输出。 具体的步骤如下: 1. 读取文件:使用Python的文件读取功能,将文件中的内容读取到一个变量中。 2. 词频统计:通过遍历所读取的文件内容,对关键词进行累计统计,并排除一些不需要统计的字符或词语,比如标点符号、空格等。 3. 生成词云图:根据词频统计的结果,使用Python中的词云生成工具,将词频高的关键词以图形化的方式展示出来。 4. 输出结果:将词频统计词云图的结果进行输出,可以以列表或其他形式展示出来。 通过以上步骤,你可以使用Python快速生成关键词-词频统计-词云生成的功能,并提升相似事务的处理效率。这是一种基本的数据分析技能,只需要Python的基本运行环境即可实现,无需其他软件或工具,且搭建成功后可重复利用。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [利用Python进行词频统计并生成词云——以京东商城iphone13购物评论为例](https://blog.csdn.net/hiroyuu008/article/details/123545702)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* [Python绘制词云图并统计词频](https://blog.csdn.net/guihunkun/article/details/118457526)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值