词云 wordcloud库

import jieba
import collections
from zhon.hanzi import punctuation
from wordcloud import WordCloud
from imageio import imread

def filter_nouseful(x):
    return (x not in ['的', '了', '呢', '时', '且', '也', '是']) and (x not in punctuation)


mask = imread('bg.jpg')  #读入背景图片,背景图片除了白色部分都可以被单词填充

w = WordCloud(font_path='msyh.ttc', width=1000, height=700, background_color='white', mask=mask, collocations=False)

f = open('word.txt', 'r', encoding='utf-8')

t = f.read()   # read()一次把全部内容读入内存
f.close()      # 关闭文件句柄

ans = jieba.lcut(t)    #分词为精确分词模式

ans = list(filter(filter_nouseful, ans))

txt = ' '.join(ans)

word_counts = collections.Counter(ans)
word_counts_top20 = word_counts.most_common(20) # 获取前20最高频的词
print(word_counts_top20)

w.generate(txt)
w.to_file('wordcloud.png')

print('完成')

wordcloud.WordCloud()返回一个类似于文件句柄的东西。

在WordCloud()中设置词云形状的具体参数。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值