如何用python做成词云_如何用python做词云pdf

匿名用户

1级

2017-08-15 回答

,决定用python绘制词云,主要用到的是wordcloud库,安装只需要pip isntall wordcloud就行,

数据用的是酒店评论的数据,代码如下:

# -*- coding: utf-8 -*-

import matplotlib.pyplot as plt

import pickle

from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator

import jieba

# import codecs

# fin = codecs.open('HotelComments.txt',mode = 'r', encoding = 'utf-8')

# print fin.read()

# 第一次运行程序时将分好的词存入文件

# text = ''

# with open('HotelComments.txt') as fin:

# for line in fin.readlines():

# line = line.strip('\n')

# text += ' '.join(jieba.cut(line))

# text += ' '

# fout = open('text.txt','wb')

# pickle.dump(text,fout)

# fout.close()

# 直接从文件读取数据

fr = open('text.txt','rb')

text = pickle.load(fr)

backgroud_Image = plt.imread('girl.jpg')

wc = WordCloud( background_color = 'white', # 设置背景颜色

mask = backgroud_Image, # 设置背景图片

max_words = 2000, # 设置最大现实的字数

stopwords = STOPWORDS, # 设置停用词

font_path = 'C:/Users/Windows/fonts/msyh.ttf',# 设置字体格式,如不设置显示不了中文

max_font_size = 50, # 设置字体最大值

random_state = 30, # 设置有多少种随机生成状态,即有多少种配色方案

)

wc.generate(text)

image_colors = ImageColorGenerator(backgroud_Image)

wc.recolor(color_func = image_colors)

plt.imshow(wc)

plt.axis('off')

plt.show()

使用Python进行词频词云分析可以通过以下步骤完成: 1. 导入所需的库:首先导入所需的库,包括`numpy`、`pandas`、`matplotlib`和`wordcloud`。 2. 读取文本数据:使用`pandas`库中的`read_csv()`函数或其他适用的函数读取文本数据,可以是CSV、Excel或文本文件。 3. 文本预处理:对于文本数据,通常需要进行一些预处理,比如去除标点符号、停用词和数字等。可以使用`re`(正则表达式)库和`nltk`(自然语言处理工具包)进行文本清洗和分词。 4. 统计词频:使用`nltk`中的`FreqDist()`函数统计每个单词的出现频率。可以选择只统计名词、动词或其他关键词分类,以提高分析效果。 5. 生成词云:使用`wordcloud`库中的`WordCloud()`函数创建词云对象。根据需要设置词云的颜色、形状和字体等属性。然后,使用`generate_from_frequencies()`函数基于词频生成词云图像。 6. 可视化:使用`matplotlib`库中的`imshow()`函数展示生成的词云图像。根据需要添加标题、调整图像大小和保存图像,使其更具吸引力和可读性。 7. 结果分析与优化:根据生成的词云图像,可以进一步分析词频高的单词,了解文本的关键词和主题。可以根据需要调整文本预处理、词云生成参数等,以获得更好的分析效果。 综上所述,以上是使用Python进行词频词云分析的基本步骤,通过适当的库和方法,可以对文本数据进行处理、分析和可视化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值