python爬虫实战案例——抓取B站视频，不同清晰度抓取，实现音视频合并，超详细！（内含完整代码）

盲敲代码的阿豪

已于 2025-01-18 21:37:11 修改

阅读量5.1k

点赞数 30

分类专栏： python之爬虫系统教学文章标签： python 爬虫音视频

于 2024-10-22 21:35:19 首次发布

本文链接：https://blog.csdn.net/m0_59470317/article/details/143143867

版权

python之爬虫系统教学专栏收录该内容

26 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

文章目录

1、任务目标
2、网页分析
3、代码编写

1、任务目标

目标网站：B站视频（https://www.bilibili.com/video/BV1se41117WP/?vd_source=e8e376ccbc5aa4cfd88e6a7917adfd1a），用于本文测验
要求：抓取该网址下的视频，将其存入本地，如下：

在这里插入图片描述

2、网页分析

在分析网页前，我们需要明白爬取的数据是什么，因为b站的视频跟音频是分开存放的，所以我们需要分别找到视频和音频的url，然后在对其发起请求将视频和音频保存至本地；最后将两者合并在一起，才能形成完整的视频文件

打开目标网站，大家可以先登录B站，这样才能下载高清视频，打开浏览器开发者模式，刷新网页，寻找数据接口

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

盲敲代码的阿豪

关注关注

30
点赞
踩
53

收藏

觉得还不错? 一键收藏
9
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

订阅专栏

python爬虫项目（五十一）：爬取各类视频直播平台数据，分析主播受欢迎程度

sybh的博客

10-03

1759

对于直播平台和主播来说，了解观众的偏好和主播的受欢迎程度是至关重要的。本文旨在通过爬虫技术从各大直播平台中提取数据，分析主播的受欢迎程度，以帮助我们更好地理解直播行业的动态。通过本项目，我们成功地爬取了斗鱼平台的直播数据，分析了主播的受欢迎程度，并通过数据可视化展示了分析结果。未来可以考虑扩展到更多直播平台的数据爬取和分析，比较不同平台间主播的受欢迎程度，深入探讨影响主播受欢迎程度的多种因素。本项目的主要目标是通过网络爬虫技术从视频直播平台中提取主播的数据，并通过分析这些数据来评估主播的受欢迎程度。

【Python爬虫(88)】当Python爬虫邂逅智能硬件：解锁数据新玩法

邓邓子的博客

02-26

2149

本文聚焦 Python 爬虫技术在智能硬件领域的应用。先阐述数字化浪潮下智能硬件对数据的需求，引出 Python 爬虫技术。接着剖析智能音箱、智能摄像头的数据采集需求，介绍在智能硬件上部署轻量级爬虫程序的方法，包括框架选择、硬件适配及部署流程。还探讨了爬虫数据的安全传输与存储策略，如协议选择、加密技术、存储方式等。最后通过案例分析展示应用成果，并对未来爬虫技术与人工智能融合、智能硬件协同工作进行展望。

9 条评论您还未登录，请先登录后发表或查看评论

B站视屏爬取

misakanetcontroller的博客

11-10

1万+

前几天写了一个上网爬取滑稽色图片（手动滑稽）的小爬虫，今天，突发奇想，想爬取视频看看。以B站敖厂长的视频实验： 1.找到要爬取视频 2.右键查看源码：与审查元素对比找到这里：EmbedPlayer('player', "//static.hdslb.com/play.swf", "cid=26379702&aid=16164197&pre_ad=0");

Python爬虫--爬取哔哩哔哩（B站）短视频平台视频

y2878672183的博客

01-18

1万+

Python爬虫--爬取哔哩哔哩（B站）短视频平台视频

B站高清视频爬取：Python爬虫技术详解

Z_suger7的博客

03-07

1795

本文详细介绍了如何使用Python爬虫技术爬取B站的高清视频。通过分析视频页面结构、提取视频地址和下载视频文件，我们实现了一个完整的爬虫脚本。同时，我们还探讨了如何处理动态加载的内容、优化下载速度以及遵守网站规则等高级优化技巧。

Python爬虫：爬取B站视频（最新、能用且讲解详细）【01】

热门推荐

knighthood2001

05-24

3万+

📚✨🎃今天，我们来实现一下，B站视频的爬取。（本文仅供学习讨论）

python爬取B站视频

meng7000的博客

03-20

7866

苦于哔站网页版以及客户端版本都没有将视频完整下载到本地的情况，因此诞生了该篇文章，讲解如何利用python去实现视频下载到本地

python简单爬取B站的视频

weixin_42292586的博客

08-12

1147

有时网络不是很好，不适合在线看，想把视频下载到本地看

python爬虫--小白篇【爬取B站视频】

weixin_56097064的博客

12-11

5076

在分析网页前，需要明白爬取的数据是什么，由于b站的视频跟音频是分开存放的，所以我们需要分别找到视频和音频的url，然后在对其发起请求将视频和音频保存至本地；最后将两者合并在一起，才能形成完整的视频文件。

python怎么爬取b站_【Python爬虫实例学习篇】——4、超详细爬取bilibili视频

weixin_39522423的博客

12-12

4784

【Python爬虫实例学习篇】——4、超详细爬取bilibili视频由于经常在B站上学习，但无奈于家里网络太差，在线观看卡顿严重，于是萌生了下载视频的想法(如果只是单纯想下载视频，请用you-get库)。废话不多说直接开干。(我发现好像很多人在爬bilibili视频的时候都有用到某个API然后还需要一个cid参数，这些在本文中没有用到。。。。)(另外再说明一下，第3篇文章没有通过审核，要看的话去公...

python+selenium爬取b站视频(得到登录后的清晰度)+绕过登录

weixin_51410591的博客

11-04

1784

之前写的简单的爬取b站视频时，发现下载的视频清晰度是的那种，影响后期使用。所以这次利用selenium启动chorme的浏览器驱动，先是获取到b站自己账号登录后的cookie进行保存，然后自动在浏览器中注入cookie，实现已登录的b站，最后爬取视频。不过，需要注意的是b站的最高清晰度是需要会员的，所以，都懂。

用python分分钟爬取B站视频

qq_41405475的博客

01-07

2037

# 导入requests模块，模拟发送请求 import requests # 导入json import json # 导入re import re # 定义请求头 headers = { 'Accept': '*/*', 'Accept-Language': 'en-US,en;q=0.5', 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, lik

Python爬虫：爬取B站视频（详细讲解）

weixin_53707653的博客

10-24

3190

没有问题，那么我们B站的视频和音频就爬取下来了~非常的ez是吧，但有个问题，既然视频和音频都爬下来了，但我们又该怎么把他们俩合并在一起形成正常的视频呢？刷过B站的都知道，B站并没有下载功能，连官网都没有下载功能的话，那我们还能正常爬取吗？毋庸置疑的就是第一个部分（视频），请大家记住这一点，接下来，我们一起打开检查来进行常规操作。可以看到，这里又有三个文件，他们仨和视频文件不一样，不一样的点在哪？Hello，大家好，我是南枫，今天带来什么项目呢？，所以我们抓下来还不行，还需要。播放正常，但，有个问题，

爬虫---爬取b站小视频

Asaasa1的博客

09-03

2849

分析b站小视频 1、进入到抓取链接地址 2、分析抓取链接内容通过F12或者抓包工具进行查看我们需要爬取的视频在哪里存放，页面以ajax动态加载的 3、分析请求内容和请求参数通过查看请求内容得到这些数据 1、请求的接口地址 2、请求方式为get 3、请求参数为 page_size 显示的个数 next_offset 动态跳转页面 tag　　搜索标题 platfrom （应该是pc端）分析了页面内容，那么动手来写代码，爬取视频下来爬取b站小视频开始写代码之前呢，我们也要一步一步的来，分

python爬取b站视频，看完这个一秒噜b站十万八千次不是梦！

Python栈_基的博客

01-18

3742

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。第一步，先对视频网页进行抓包，可以发现这两个请求是视频相关的。

Python Spider学习笔记（一）：爬取B站视频基本信息

Smile_to_destiny的博客

09-03

6988

主要介绍了通过selenium库实现无界面爬虫，进而根据关键词搜索，获取B站展示出来的所有的结果的bvid，进而再利用bvid结合API来获取相关视频的所有信息。

用python爬取下载b站视频

qq_38887171的博客

10-19

1478

B站之所以火，是因为趣味与知识并存。正如一句“你在B站看番，我在B站学习”，B站还是有一些质量比较好的学习视频。当你在B站上看到喜欢的视频想保存下来时，怎么办呢？转入正题，本篇推文主要介绍如何将B站上把喜欢的视频下载下来，帮助更多需要学习的小伙伴，详细步骤如下：网页分析视频下载方法成果展示微信视频号的加入，再度引燃了短视频领域，今天我们爬取B站的每天播放量最多的小视频，其他类型的视频可以参考这个方法。视频下载方法上一部分已对网页进行了分析，现...

Python爬取B站视频

Monster_27的博客

06-26

1983

今天有点闲,想着爬取一下哔哩哔哩的视频练练手. 说干就干!打开B站,搜索"鸡你太美",大叔就是这么潮流,哈哈.废话不多说,吭哧吭哧开始肝. F12—>Network—>一无所获. 在我的理解中,视频应该有个访问连接的呀,而且放在json格式的文件中,这样我们直接访问资源URL就可以下载到视频了呀. 然而,并没有. 接下里就是长达四五个小时的文献参考以及试错. 在网上看到的都是从up主个人主页里下载视频的,和我的预期有些不符,所以我们就先看前辈们的资料吧. 我们来到一个up主的个人中心,开始吭哧吭

python爬虫爬取b站视频_爬虫---爬取b站小视频

weixin_39876650的博客

11-20

1216

前面通过python爬虫爬取过图片，文字，今天我们一起爬取下b站的小视频，其实呢，测试过程中需要用到视频文件，找了几个网站下载，都需要会员什么的，直接写一篇爬虫爬取视频~~~分析b站小视频1、进入到抓取链接地址2、分析抓取链接内容通过F12或者抓包工具进行查看我们需要爬取的视频在哪里存放，页面以ajax动态加载的3、分析请求内容和请求参数通过查看请求内容得到这些数据1、请求的接口地址2、请求方式为...

如何爬虫B站视频

最新发布

03-11

<think>好的，用户想了解如何用Python编写爬虫来抓取B站视频。我需要先整理一下已有的引用内容，看看能提供哪些有效信息。首先，引用[1]提到使用selenium库和xpath选择器来获取B站视频选集内容，并附有源码。这可能涉及到模拟浏览器操作和页面解析。引用[2]和[4]讨论了处理B站的加密规则，可能需要分析JavaScript代码，找到加密参数如sign值，然后用Python复现。引用[3]提供了一个GitHub仓库的链接，可能有现成的代码示例。引用[5]则提到了一些资源和技术支持，但可能对具体方法帮助不大。接下来，我需要确定用户的需求层次。用户可能是个刚入门的Python开发者，想了解基本的爬虫方法，但B站的反爬机制比较严格，尤其是视频流的加密处理。所以步骤可能包括分析页面结构、处理加密参数、获取视频链接、下载视频等。需要分步骤说明：首先分析网页结构，找到视频请求的接口；然后处理加密参数，可能需要逆向JS代码；接着获取视频的m4s链接；最后下载并合并视频片段。同时，注意遵守法律法规和B站的使用条款，避免法律风险。另外，引用中提到的常见问题处理方法，比如使用selenium应对动态加载，以及可能遇到的加密混淆，需要详细说明如何处理。比如在引用[4]中，作者遇到了混淆的JS代码，需要找到核心加密部分并用Python实现。这可能涉及到生成sign参数，这是B站API接口的常见验证方式。还要考虑是否需要使用第三方库，比如requests、selenium、json等，以及如何解析返回的JSON数据。最后，代码示例需要简洁明了，演示整个流程，但也要提醒用户不要滥用爬虫，尊重网站的robots.txt协议。总结步骤：1. 分析接口；2. 处理加密参数；3. 请求数据；4. 解析并下载视频。同时，给出一个代码框架，并指出可能需要进一步处理的地方，比如合并视频片段。最后，生成相关问题，帮助用户深入理解可能遇到的挑战和解决方案。</think>### 使用Python进行B站视频爬虫的方法和教程 #### 一、基本思路 1. **分析视频请求接口** B站视频通常由多个分片（m4s格式）组成，需通过接口获取视频的真实地址。可以通过浏览器开发者工具（F12）的`Network`面板，筛选`XHR`或`Media`类型请求，找到类似`api.bilibili.com/x/player/playurl`的接口[^2][^4]。 2. **处理加密参数** B站接口请求需要携带`sign`值、`buvid`等加密参数，这些参数通过混淆的JavaScript生成。需逆向JS代码或使用现成的解密库（如`bili23`）生成签名[^4]。 3. **解析并下载视频** 获取视频的`m4s`链接后，需合并音视频分片，并使用`FFmpeg`或代码合并为完整MP4文件。 --- #### 二、具体实现步骤 ##### 1. 获取视频信息接口 ```python import requests def get_video_info(bvid): url = f"https://api.bilibili.com/x/web-interface/view?bvid={bvid}" headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36..." } response = requests.get(url, headers=headers) return response.json() ``` 调用此函数可获取视频的`cid`（分集ID）、标题等信息[^2]。 ##### 2. 生成加密参数（核心步骤）需通过逆向JS代码生成`sign`参数。以下是简化的Python实现： ```python import time import hashlib def generate_sign(params): salt = "自定义盐值（需从JS中提取）" raw_str = f"{params}{salt}" sign = hashlib.md5(raw_str.encode()).hexdigest() return sign ``` 具体盐值需从B站JS文件（如`player.so`）中提取，或参考开源项目[^3][^4]。 ##### 3. 请求视频地址 ```python def get_video_url(bvid, cid): base_url = "https://api.bilibili.com/x/player/playurl" params = { "bvid": bvid, "cid": cid, "qn": 80, # 视频清晰度 "fnval": 16, "fourk": 1 } params["sign"] = generate_sign(params) # 添加签名 response = requests.get(base_url, params=params, headers=headers) return response.json() ``` 返回的JSON数据中会包含`durl`字段，存储视频分片地址。 ##### 4. 下载并合并视频 ```python def download_video(url, filename): headers = {"Referer": "https://www.bilibili.com"} response = requests.get(url, headers=headers, stream=True) with open(filename, 'wb') as f: for chunk in response.iter_content(chunk_size=1024): if chunk: f.write(chunk) ``` 需循环下载所有分片（`durl`列表），并使用`ffmpeg`合并： ```bash ffmpeg -i video.m4s -i audio.m4s -c copy output.mp4 ``` --- #### 三、注意事项 - **法律风险**：遵守B站`robots.txt`协议，避免大规模爬取或商用[^1]。 - **反爬机制**：需处理Cookie验证、IP封禁等问题，可使用代理池或降低请求频率。 - **动态渲染**：若页面内容通过JavaScript加载，需使用`selenium`模拟浏览器操作[^1]。 ---