python根据文章生成词云

from wordcloud import WordCloud
import jieba
import PIL
import matplotlib.pyplot as plt
import numpy as np


def wordcloudplot(txt):
    path = r'C:/Users/wjt/Desktop/msyh.ttf'
    alice_mask = np.array(PIL.Image.open('C:/Users/wjt/Desktop/timg.jpg'))
    wordcloud = WordCloud(font_path=path,
                          background_color="white",
                          margin=5, width=1800, height=800, mask=alice_mask, max_words=2000, max_font_size=60,
                          random_state=42)
    wordcloud = wordcloud.generate(txt)
    wordcloud.to_file('C:/Users/wjt/Desktop/hhhaa.jpg')
    plt.imshow(wordcloud)
    plt.axis("off")
    plt.show()


def main():
    a = []
    f = open(r'C:/Users/wjt/Desktop/tlbb.txt', 'r').read()
    words = list(jieba.cut(f))
    for word in words:
        if len(word) > 1:
            a.append(word)
    txt = r' '.join(a)
    wordcloudplot(txt)


if __name__ == '__main__':
    main()


哈哈,这次不按套路出牌,先直接上代码,首先要安装PIL,wordcloud,jieba。。我在安装的时候报VC9.0错误,根据错误返回的信息:error: Microsoft Visual C++ 9.0 is required. Get it from http://aka.ms/vcpython27到这个网站里面下载安装VC组件。分析下,path=r"C:/User/......."必须要有的,不然生成不了中文词云。alice_mask是结构图,也就是这只鸟,经过测试白底颜色鲜明的图才能生成结构清晰的词云。wordCloud的构造函数意思如下

background_color = 'white',    # 设置背景颜色

mask = alice_mask,        # 设置背景图片
max_words = 2000,            # 设置最大现实的字数
stopwords = STOPWORDS,        # 设置停用词
font_path = path,# 设置字体格式,如不设置显示不了中文
max_font_size = 50,            # 设置字体最大值

random_state = 30,            # 设置有多少种随机生成状态,即有多少种配色方案

然后就是设置生成图片的路径,设置文字,开始生成。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值