最近在做一个的统计小工具,用到了词云和词频统计功能。 其实之前在做采集的项目时,这二个模块已经用得比较多了,在我看来,还是能归到趣玩Python系列当中的,希望对没有使用过的朋友有所帮助,直接进入正文吧!
最近李子柒更新了一个蓝印花布的视频,在微博爆火,当然,那是视频,在文章中没办法去抓里面的字幕,其实也可以实现(opencv进行处理),本文中就不再进行细说,如果有可能,下一个趣玩系列更新时我会写入到其中。
这次需要分析的文本我已经下载并保存好,起名为article.txt文件。另外我还准备了一个名为base_show.jpeg的背景文件,一会在使用的过程中我会进行使用说明。
1、先安装必要模块:
import reimport collectionsimport jiebafrom wordcloud import WordCloudimport matplotlib.pyplot as pltfrom PIL import Imageimport numpy as np
2、新建main.py 文件 ,