Python爬虫入门教程 32-100 B站博人传评论数据抓取 scrapy

最新推荐文章于 2024-01-04 21:03:50 发布

梦想橡皮擦

最新推荐文章于 2024-01-04 21:03:50 发布

阅读量2.1w

点赞数 8

分类专栏：爬虫100例教程文章标签： scrapy爬虫 python3爬虫数据爬虫 B站爬虫

梦想橡皮擦-独家版权，禁止转载

本文链接：https://blog.csdn.net/hihell/article/details/84779709

版权

爬虫100例教程专栏收录该内容

118 篇文章 1562 订阅 ¥99.90 ¥299.90

订阅专栏

本文介绍了如何使用Python的Scrapy框架抓取B站博人传评论数据，包括获取评论链接、实现随机User-Agent、完善Item、提高爬取速度以及数据保存的方法。通过设置下载延迟、启用多线程和禁用cookies等策略来优化爬虫性能。

摘要由CSDN通过智能技术生成

1. B站博人传评论数据爬取简介

今天想了半天不知道抓啥，去B站看跳舞的小姐姐，忽然看到了评论，那就抓取一下B站的评论数据，视频动画那么多，也不知道抓取哪个，选了一个博人传跟火影相关的，抓取看看。网址： https://www.bilibili.com/bangumi/media/md5978/?from=search&seid=16013388136765436883#short
在这个网页看到了18560条短评，数据量也不大，抓取看看，使用的还是scrapy。

在这里插入图片描述

2. B站博人传评论数据案例—获取链接

从开发者工具中你能轻易的得到如下链接，有链接之后就好办了，如何创建项目就不在啰嗦了，我们直接进入主题。

了解本专栏

梦想橡皮擦

关注

8
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

梦想橡皮擦 如有帮助，来瓶可乐

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。