前言
最近刚好在看爬虫,就爬取一下春节祝福语,生成个词云玩一玩,大家有兴趣可以试试,会奉上源代码,很简单。效果图如下:
环境
-
环境:windows,
-
语言:python,python版本是3.7
-
所依赖的第三方包:
selenium----爬取网站,收集祝福语,这个库做UI自动化测试的估计会比较常见,我这里没采用使用requests库去爬取,用这个库的好处是爬取的过程中页面是实时可见的
wordcloud---用来生成词云
PIL---使词云生成想要的轮廓, 这里注意python3.7安装的时候应该使用pip install pillow
numpy---生成那种有轮廓的词云,还需要安装这个包,这个包将给出形状的图片表示为一个大型矩阵
jieba---词云生成的词默认是英文,因我们爬取的祝福语是中文,需要用这个库能识别中文,防止中文乱码
以上有兴趣,可以自行这些库加深了解。