每日10行代码32：用python生成词云

最新推荐文章于 2021-12-22 17:05:39 发布

天天卡丁

最新推荐文章于 2021-12-22 17:05:39 发布

阅读量424

点赞数

分类专栏：每日10行代码 Python 文章标签： python

本文链接：https://blog.csdn.net/weixin_44981444/article/details/108789928

版权

每日10行代码同时被 2 个专栏收录

178 篇文章 18 订阅

订阅专栏

Python

176 篇文章 4 订阅

订阅专栏

今天测试下使用词云，代码如下：

# python3.6.4
from wordcloud import WordCloud
import jieba
from imageio import imread
from os import path
import matplotlib.pyplot as plt
from PIL import Image, ImageDraw, ImageFont


# 绘制词云
def draw_wordcloud():
    #读入一个txt文件
    comment_text = open('data.txt','r',encoding='utf-8').read()
    #结巴分词，生成字符串，如果不通过分词，无法直接生成正确的中文词云
    cut_text = " ".join(jieba.cut(comment_text))
    d = path.dirname(__file__) # 当前文件文件夹所在目录
    #color_mask = imread("1.jpg") # 读取背景图片
    cloud = WordCloud(
        #设置字体，不指定就会出现乱码
        font_path="C:/Windows/Fonts/STXINGKA.TTF",
        #font_path=path.join(d,'simsun.ttc'),
        #设置背景色
        background_color='white',
        #词云形状
        #mask=color_mask,
        #允许最大词汇
        max_words=2000,
        #最大号字体
        max_font_size=100
    )
    word_cloud = cloud.generate(cut_text) # 产生词云
    word_cloud.to_file("bilibilirankword.jpg") #保存图片
    # 显示词云图片
    plt.imshow(word_cloud)
    plt.axis('off')
    plt.show()

if __name__ == '__main__':
    draw_wordcloud()