画词云图(pyecharts和wordcloud)

本篇文章讲pyecharts和wordcloud两种方式画词云图,代码如下:
因为pyecharts的输入数据类型是列表中嵌套元组,类似下面这种的:

[('REX', 54), ('CASH+CARRY', 54), ('JUMBO', 824), ('SHOPPER', 147), ('BAG', 1951), ('VINTAGE', 1325), ('LEAF', 134), ('PEACE', 11), ('WOODEN', 507), ('BLOCK', 109)]

所以先把字符串describe_document变为字典,然后再list(字典.items())转为pyecharts需要的数据格式。

from pyecharts.charts import WordCloud

frequency = {}
for word in describe_document.split():
    if word not in frequency:
        frequency[word] = 1
    else:
        frequency[word] += 1
      
word_list = list(frequency.items())
word_list

mywordcloud = WordCloud()
mywordcloud.add('',word_list, shape='circle')

# 渲染图片
mywordcloud.render_notebook()

在这里插入图片描述
wordcloud库的generate函数可以直接对字符串文本进行分词

from wordcloud import WordCloud         
import matplotlib.pyplot as plt

# 数据采样
data = data.sample(20000,random_state = 22)

# 文本拼接
describe_document = " ".join(data['describe_cutted'])

fig = plt.figure(figsize=(20,10))

# 创建词云对象
wordcloud = WordCloud(background_color = "white",
              random_state = 30,
              scale = 2,
              collocations = False
              )

# 生成词云
wordcloud.generate(describe_document)
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

在这里插入图片描述

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值