闲来无事整理自己的磁盘空间的时候翻看到了自己之前在学习过程中的各种小程序,随便点开来发现很多小知识点自己都已经忘记了,借着这个机会给自己回顾一下知识点,也让初学者们有一些参考的小程序练练手
爬取B站弹幕
今天分享的是一个简单的爬取b站弹幕的方法,只需要用最简单的requests库就能够完成这个功能,也算是一个入门的爬虫小程序吧~
想要爬取一个b站视频的弹幕很简单,首先挑选一个想要爬取的视频链接,这里以才浅的三星堆面具为例:
https://www.bilibili.com/video/BV16X4y1g7wT
其实在网页右侧也有弹幕列表,能够通过F12快速定位到弹幕列表,但在这里给没有web基础的同学介绍一个更简单的方法,将链接修改为:
https://www.ibilibili.com/video/BV16X4y1g7wT
此时能够看到
通过这个弹幕地址直接访问便可以看到弹幕列表的xml文件了,那么接下来爬取弹幕便很简单了
import requests
import re
# 爬取的url地址
url =