零基础实现基于python2.7 的中文词频统计和词云绘制（二）

最新推荐文章于 2024-09-06 10:00:00 发布

wj_warmly

最新推荐文章于 2024-09-06 10:00:00 发布

阅读量409

点赞数

分类专栏： wordcloud python打包 python 词云 jieba pyinstaller

本文链接：https://blog.csdn.net/wj_warmly/article/details/85698866

版权

python 同时被 3 个专栏收录

5 篇文章 0 订阅

订阅专栏

wordcloud

2 篇文章 0 订阅

订阅专栏

python打包

2 篇文章 0 订阅

订阅专栏

二、关于词频统计和词云生成的完整代码

打开python自带的IDLE，新建一个文件，然后把下面的代码粘进去保存。

#coding:utf-8
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt

import sys
reload(sys)
sys.setdefaultencoding('utf-8')
f = open(u'e://pythonciyun//test.txt','r').read() #本地建一个文本文档存放需要分析的文本内容，编码格式必须为utf-8
s={}
f=jieba.cut(f)
for w in f:
    if len(w) >1:
        previous_count=s.get(w,0)
        s[w] = previous_count +1
items = list(s.items())
items.sort(key= lambda x:x[1],reverse=True)
wf=open("output.txt",'w')  #统计出来的词频写到output文件中
for i in range(100):
    word,count = items[i]
    print word,count
    wf.write(word + ''+str(count)+'\n')
word_freq ={x[0]:x[1] for x in items}
wordcloud = WordCloud(font_path = 'c:\windows\Fonts\MSYH.TTF').fit_words(word_freq)
wf.close()
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

保存后，点击Run->Run Module运行程序，会在程序所在目录生成output.txt文件，同时弹出词云图。

统计词频和生成词云的功能就完成了，剩下的就是打包成exe了。

三、打包生成exe

方法：打开cmd，切换到~\python27\script目录下，执行命令

pyinstaller -F E:\python文件保存的目录\abc.py

命令执行成功后，会在script目录下生成一个dist文件，文件中的exe文件就是生成的可执行程序。

遇到问题：

在打包过程中遇到了很多的问题，花费了很大的精力，就在绝望无路的时候，偶然在一篇博文中找到了解决方法。这个这篇博文的地址，我遇到的问题这篇博文里解释的很清楚。http://www.pianshen.com/article/996685916/

另外，打包过程中还出现一个错误：str object has no attribute 'items'。这是依赖包的版本问题导致的，需要升级一下setuptools,

pip install -U --pre setuptools