中文分词(jieba)+tfidf分词+去停词+自定义词典+词云(wordcloud)

这是我使用一份简历描述做的词云。

使用了自定义词典。

使用了停词词典。

效果还不错吧!

import jieba
import jieba.analyse
import wordcloud
from scipy.misc import imread
mask = imread("chinamap.jpg")
excludes = { }
f = open("1.txt", "r", encoding="utf-8")
t = f.read()
f.close()
jieba.load_userdict("dic.txt")
jieba.analyse.set_stop_words("stop.txt")
ls = jieba.analyse.extract_tags(t,topK=100) 
txt = " ".join(ls)
w = wordcloud.WordCloud(\
    width = 1000, height = 700,\
    background_color = "white",mask =mask,font_path='/Library/Fonts/Songti.ttc',\
    )
w.generate(txt)
w.to_file("grwordcloudm.png")

词云

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值