前言
选了个西游记的片段,爬完发现一群啊啊怪
![](https://i-blog.csdnimg.cn/blog_migrate/03a2507ff732b2d86c8e8a8719059707.jpeg#pic_center)
一、爬虫分析
首先看看今天要爬取的表情包网址(弹幕太多了,就选择了12月1日的弹幕,一次似乎只能爬1000条)
https://www.bilibili.com/video/BV1Sa411A7UV?from=search&seid=14924726153743360390
1.分析网址
首先点击F12,根据1234步骤依次点击network->XHR->查看历史弹幕->点击12月1日的弹幕,然后观察右侧数据
每个都点击看看Preview,发现history里有弹幕数据,那么我们就在Headers拿它的网址和cookie信息进行解析
二、完整代码
附上完整代码和详细注释
import requests
import re
import csv
import matplotlib.pyplot as plt
import