python生成词云很慢吗_python生成词云，要求频率越小生成的字词越大，老师的要求，请各位大佬解答，感谢，急急急！！！...

weixin_39984963

于 2020-12-17 22:01:33 发布

阅读量102

点赞数

文章标签： python生成词云很慢吗

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39984963/article/details/111453513

版权

importjiebafile=open('article_title','r',encoding='utf-8')duanzi=file.read()file.close()sep='''-/.。""'',!?;:~`·[]\，：；“”？！-、}{【】‘’'''exclude={'','\ue412','\x...

import jieba

file = open('article_title', 'r', encoding='utf-8')

duanzi = file.read()

file.close()

sep = '''-/.。""'',!?;:~`·[] \ ，：；“”？！-、}{【】‘’'''

exclude = {' ','\ue412','\x01','我','了','的','你','来','我们','被','……','…'}

for char in sep:

duanzi = duanzi.replace(char,'')

duanziList = list(jieba.cut(duanzi))#分词

duanziDict = {}

duanziciyun = {}

duanzis = list(set(duanziList)-exclude)#删除非中国汉语字符

for d in range(0,len(duanzis)):

duanziDict[duanzis[d]] = duanzi.count(str(duanzis[d]))

dictList = list(duanziDict.items())

dictList.sort(key=lambda x:x[1],reverse=False)

f = open('count.txt','a',encoding='utf-8')

for i in range(0, len(dictList)):

print(dictList[i])

f.write(dictList[i][0] + ':' + str(dictList[i][1]) + '\n')

duanziciyun[dictList[i][0]] = dictList[i][1]

f.close()

# 生成词云

from PIL import Image, ImageSequence

import numpy as np

import matplotlib.pyplot as plt

from wordcloud import WordCloud, ImageColorGenerator

font = r'zhongwen.ttf'

image = Image.open('3.jpg')

graph = np.array(image)

wc = WordCloud(font_path=font, background_color='White', max_words=5000, mask=graph)

wc.generate_from_frequencies(duanziciyun)

image_color = ImageColorGenerator(graph)

plt.imshow(wc)

plt.axis("off")

plt.show()

wc.to_file(r'new.png')

展开

weixin_39984963

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python生成词云很慢吗_python生成词云，要求频率越小生成的字词越大，老师的要求，请各位大佬解答，感谢，急急急！！！...

importjiebafile=open('article_title','r',encoding='utf-8')duanzi=file.read()file.close()sep='''-/.。""'',!?;:~`·[]\，：；“”？！-、}{【】‘’'''exclude={'','\ue412','\x...import jiebafile = open('article_title', ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。