【案例】使用Python实现词云可视化

该博客分享了一个使用Python爬取CVPR2018论文标题,进行数据处理并生成词云进行可视化分析的研究案例。通过爬虫获取数据,去除标题中的冒号,组合成字符串,再利用词云库创建词云图,展示了当年的研究热点词汇。
摘要由CSDN通过智能技术生成

一、案例说明

通过对CVPR2018的论文标题的单词进行统计,利用词云进行可视化,来分析当年的研究热点词汇。

目标网站为CVPR 2018 Open Access Repository

二、具体步骤

2.1 爬虫准备数据

首先通过爬虫爬取CVPR官网上的论文标题以及作者的名字,得到初始的数据。

然后将得到的数据进行预处理,得到我们想要的数据。步骤如下:

首先观察目标网站的数据格式,查看网页源代码,定位到我们需要的论文标题和作者的数据,通过requests库发送请求,得到网页文本,然后用BeautifulSoup库来解析网页文本的标签对,得到我们要的数据,并返回列表。

代码如下:

<
  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值