【案例】使用Python实现词云可视化

最新推荐文章于 2024-07-19 15:17:08 发布

小贝壳吖

最新推荐文章于 2024-07-19 15:17:08 发布

阅读量930

点赞数 3

分类专栏： Python学习之路文章标签：词云爬虫 Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40287093/article/details/96450465

版权

该博客分享了一个使用Python爬取CVPR2018论文标题，进行数据处理并生成词云进行可视化分析的研究案例。通过爬虫获取数据，去除标题中的冒号，组合成字符串，再利用词云库创建词云图，展示了当年的研究热点词汇。

摘要由CSDN通过智能技术生成

一、案例说明

通过对CVPR2018的论文标题的单词进行统计，利用词云进行可视化，来分析当年的研究热点词汇。

目标网站为CVPR 2018 Open Access Repository

二、具体步骤

2.1 爬虫准备数据

首先通过爬虫爬取CVPR官网上的论文标题以及作者的名字，得到初始的数据。

然后将得到的数据进行预处理，得到我们想要的数据。步骤如下：

首先观察目标网站的数据格式，查看网页源代码，定位到我们需要的论文标题和作者的数据，通过requests库发送请求，得到网页文本，然后用BeautifulSoup库来解析网页文本的标签对，得到我们要的数据，并返回列表。

代码如下：

最低0.47元/天解锁文章

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。