python爬取春节祝福语,并生成心形词云

本文介绍了一种使用Python爬虫从百度抓取春节祝福语,并利用wordcloud库生成心形词云的方法。通过selenium模拟浏览器操作,收集祝福语并保存到文件,再借助jieba进行中文处理,最后生成具有特定轮廓的词云效果。
摘要由CSDN通过智能技术生成

 

前言

最近刚好在看爬虫,就爬取一下春节祝福语,生成个词云玩一玩,大家有兴趣可以试试,会奉上源代码,很简单。效果图如下:

 

环境

  1. 环境:windows,

  2. 语言:python,python版本是3.7

  3. 所依赖的第三方包:

    selenium----爬取网站,收集祝福语,这个库做UI自动化测试的估计会比较常见,我这里没采用使用requests库去爬取,用这个库的好处是爬取的过程中页面是实时可见的

    wordcloud---用来生成词云

    PIL---使词云生成想要的轮廓, 这里注意python3.7安装的时候应该使用pip install pillow

    numpy---生成那种有轮廓的词云,还需要安装这个包,这个包将给出形状的图片表示为一个大型矩阵

    jieba---词云生成的词默认是英文,因我们爬取的祝福语是中文,需要用这个库能识别中文,防止中文乱码

以上有兴趣,可以自行这些库加深了解。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值