【小盐巴学习笔记】—用Python爬取bilibili弹幕并生成词云图

本文介绍了如何使用Python爬取Bilibili的弹幕数据,并通过分析生成词云图。作者选取了一个西游记片段,发现在12月1日的弹幕后,出现大量'啊啊怪'的现象。文章详细讲解了爬虫分析过程,包括观察网址、获取cookie信息,以及完整的爬虫代码实现和运行效果。
摘要由CSDN通过智能技术生成

前言

选了个西游记的片段,爬完发现一群啊啊怪

一、爬虫分析

首先看看今天要爬取的表情包网址(弹幕太多了,就选择了12月1日的弹幕,一次似乎只能爬1000条)

https://www.bilibili.com/video/BV1Sa411A7UV?from=search&seid=14924726153743360390

1.分析网址

首先点击F12,根据1234步骤依次点击network->XHR->查看历史弹幕->点击12月1日的弹幕,然后观察右侧数据
在这里插入图片描述

每个都点击看看Preview,发现history里有弹幕数据,那么我们就在Headers拿它的网址和cookie信息进行解析


在这里插入图片描述
在这里插入图片描述

二、完整代码

附上完整代码和详细注释

import requests
import re
import csv
import matplotlib.pyplot as plt
import
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值