二、关于词频统计和词云生成的完整代码
打开python自带的IDLE,新建一个文件,然后把下面的代码粘进去保存。
#coding:utf-8
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
f = open(u'e://pythonciyun//test.txt','r').read() #本地建一个文本文档存放需要分析的文本内容,编码格式必须为utf-8
s={}
f=jieba.cut(f)
for w in f:
if len(w) >1:
previous_count=s.get(w,0)
s[w] = previous_count +1
items = list(s.items())
items.sort(key= lambda x:x[1],reverse=True)
wf=open("output.txt",'w') #统计出来的词频写到output文件中
for i in range(100):
word,count = items[i]
print word,count
wf.write(word + ''+str(count)+'\n')
word_freq ={x[0]:x[1] for x in items}
wordcloud = WordCloud(font_path = 'c:\windows\Fonts\MSYH.TTF').fit_words(word_freq)
wf.close()
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
保存后,点击Run->Run Module运行程序,会在程序所在目录生成output.txt文件,同时弹出词云图。
统计词频和生成词云的功能就完成了,剩下的就是打包成exe了。
三、打包生成exe
方法:打开cmd,切换到~\python27\script目录下,执行命令
pyinstaller -F E:\python文件保存的目录\abc.py
命令执行成功后,会在script目录下生成一个dist文件,文件中的exe文件就是生成的可执行程序。
遇到问题:
在打包过程中遇到了很多的问题,花费了很大的精力,就在绝望无路的时候,偶然在一篇博文中找到了解决方法。这个这篇博文的地址,我遇到的问题这篇博文里解释的很清楚。http://www.pianshen.com/article/996685916/
另外,打包过程中还出现一个错误:str object has no attribute 'items'。这是依赖包的版本问题导致的,需要升级一下setuptools,
pip install -U --pre setuptools