豆瓣精选话题爬虫数据分析小尝试

本文作者分享了使用VBA进行豆瓣精选话题爬虫的经验,抓取了标题、发表日期、来源小组和喜欢数等数据,并进行了初步的数据分析,发现2016年12月为赞数最多的月份,计划进一步探究数据峰值点和相关话题。
摘要由CSDN通过智能技术生成

首发于我的知乎,转载请注明出处。谢谢~

最近这两天在研究爬虫,所以在学数据分析的主流语言和各种包。
不过正好也在写VBA的专栏,所以突发奇想,要不要先用VBA做个爬虫试试,正好学一下网页结构什么的,做个很流行的仪表盘什么的。
因为豆瓣精选不需要登录,就决定分析它啦。
( • ̀ω•́ )✧

写在前面:
木有学过编程,VBA也是为了方便工作自己捣鼓的。所以代码都是实用至上,可能写法不够专业。如果对优化代码有什么建议,非常非常欢迎私信交流哟。
PS这次算是个爬虫和数据分析的小实验,所以抓取的数据不多,数据分析结果仅供参考。


于是,就有了下面的东西。嗯!

1.分析网址
douban.com/group/explor

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值