python爬虫实践-B站弹幕分析

本文是作者python爬虫实践系列的第三篇,主要介绍了如何爬取B站的弹幕数据。通过主程序模块和子函数,实现了访问弹幕数据、解析数据并保存到doc文件的过程。爬虫主要步骤包括提取网页、筛选所需数据和存储分析。
摘要由CSDN通过智能技术生成

系列文章目录

python爬虫实践–晋江小说书籍分析
python爬虫实践-腾讯视频弹幕分析
python爬虫实践-B站弹幕分析



前言

在前两次的晋江小说和腾讯弹幕爬取基础上,我逐渐觉得自己掌握了这门技术的奥义?于是迫不及待地又对准了我的下一个目标——B站。
为什么是B站?作为弹幕文化的大本营,必须是B站,B站的大部分有趣都来自于弹幕。

目录

在这里插入图片描述
与前两个爬虫实践如出一辙,都是一个主函数作为程序入口,并调用子函数。其它几个def定义的子函数分别来处理不同阶段的数据。

该程序用到的头文件

import requests
from bs4 import BeautifulSoup
from docx 
  • 2
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值