python快速使用词云

from wordcloud import WordCloud, ImageColorGenerator
import jieba
import matplotlib.pyplot as plt
from PIL import Image
import numpy as np


# 安装:pip install wordcloud

def wc_genator():
    """
    词语生成
    :return:
    """
    # 1、加载文档数据
    with open('./让我们荡起双桨.txt', 'r', encoding='utf-8') as fp:
        content = fp.read()
        print('content:\n', content)

    # 2、jieba 分词
    seg = jieba.cut(content, cut_all=False)
    # 拼接
    seg_str = ','.join(seg)
    print('分词之后的文本内容:\n', seg_str)

    # 3、加载停止词文件,并处理停止词
    with open('./stopwords.txt', 'r', encoding='utf-8') as fp:
        # 读取内容
        st_words = fp.readlines()
        # print('st_words:\n', st_words)
        # 剔除 停止词两侧的 空白字符
        st_words = [words.strip() for words in st_words]
        # 剔除重复的 停止词
        st_words = list(set(st_words))
        # print('st_words:\n', st_words)

    # 4、生成词云对象
    wc = WordCloud(font_path='./simhei.ttf',  # 字体路径
                   width=400,  # 词云宽度
                   height=200,  # 词云高度
                   background_color='white',  # 背景颜色
                   stopwords=st_words,  # 停止词
                   # mask=  # 可以自定义图片
                   )
    # 5、组合 词云对象 和文本 生成 词云文本
    wc_text = wc.generate(seg_str)

    # 6、展示
    # 展示样式
    # interpolation='bilinear': 展示为线性,横平竖直的样式
    plt.imshow(wc_text, interpolation='bilinear')

    # 关闭坐标系
    plt.axis('off')

    # 展示图片
    plt.show()
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值