对于喜欢的书,想更多的了解它。利用Python的jieba库和wordcloud库,可以统计书中的高频词并生成词云,小试了两本书:一本是《百年孤独》,另一本是近期读完的一本《山茶文具店》。
- 库准备
下载对应python版本及操作系统的安装包,安装好jieba库和wordcloud库,可参考博文。
wordcloud官网,也可参考这篇中文博客。
jieba的github介绍及用例,中文介绍很详尽。
- Input输入文件准备
为了生成词云,需要先准备好下图中的红字文件(运行本文的代码后将生成绿字文件)。