爬bilibili网站视频

LucianaiB

已于 2024-08-21 09:21:49 修改

阅读量391

点赞数 8

分类专栏：爬虫学习文章标签：音视频 python 开发语言爬虫

于 2024-08-21 09:17:44 首次发布

本文链接：https://blog.csdn.net/lwcwam/article/details/141379420

版权

爬虫学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

直接看效果：

背景：

为了从Bilibili（哔哩哔哩）视频分享平台上下载视频和音频，并将它们合并成一个完整的视频文件。Bilibili是中国非常流行的视频分享网站，用户可以在上面观看和分享各种类型的视频内容。由于Bilibili的视频和音频是分开存储的，因此需要分别下载并合并它们。

以下是代码的详细背景和功能说明：

导入必要的库：
- requests：用于发送HTTP请求。
- json：用于解析JSON数据。
- pprint：用于美化打印输出。
- re：用于正则表达式操作。
- os：用于操作系统相关功能，如文件和目录操作。
- subprocess：用于执行系统命令。
- sys：用于与Python解释器进行交互。
获取URL响应体：
- getResponse(url)函数发送一个GET请求到指定的URL，并返回响应对象。请求头中包含了referer和User-Agent，以模拟浏览器请求，避免被Bilibili服务器拒绝。
解析响应体：
- parseResponse(url)函数首先调用getResponse(url)获取响应体，然后使用正则表达式提取视频数据和标题。提取到的数据解析成JSON格式，从中获取音频和视频的URL，并封装成一个字典返回。
保存视频和音频：
- saveMedia(fileName, content, mediaType)函数用于将下载的音频和视频内容保存到本地文件系统中。文件保存在D:\\bilibili目录下，文件名为视频标题，扩展名根据媒体类型（音频为mp3，视频为mp4）确定。
合并音频和视频：
- AvMerge(Mp3Name, Mp4Name, savePath)函数使用ffmpeg工具将音频和视频合并成一个文件。合并后的文件保存在指定路径，并删除临时的音频和视频文件。
主函数：
- main()函数是程序的入口。用户输入Bilibili视频的URL，程序解析视频信息，下载音频和视频，并保存到本地。最后，调用AvMerge函数将音频和视频合并成一个完整的视频文件。

直接上代码：

import requests
import json
import pprint
import re
import os
import subprocess
import sys

"""获取url响应体"""
def getResponse(url):
    # 设置请求头
    headers = {
        'referer': 'https://www.bilibili.com/',
        'User-Agent': '你自己的'
    }
    # 发起get请求
    response = requests.get(url=url, headers=headers)
    return response

"""解析响应体"""
def parseResponse(url):
    # 获取url响应体
    response = getResponse(url)
    # 用正则表达式取出返回的视频数据
    html_data = re.findall('<script>window.__playinfo__=(.*?)</script>', response.text)[0]
    # 解析成json数据
    jsonData = json.loads(html_data)
    # 获取视频标题
    videoTitle = re.findall('<title data-vue-meta="true">(.*?)</title>', response.text)[0]
    # 获取音频
    audioUrl = jsonData['data']['dash']['audio'][0]['baseUrl']
    # 获取视频
    videoUrl = jsonData['data']['dash']['video'][0]['baseUrl']
    # 封装视频信息
    videoInfo = {
        'videoTitle': videoTitle,
        'audioUrl': audioUrl,
        'videoUrl': videoUrl,
    }
    print("获取Response信息成功！")
    return videoInfo

"""保存视频和音频"""
def saveMedia(fileName, content, mediaType):
    # 创建目录（如果不存在）
    os.makedirs('D:\\bilibili', exist_ok=True)
    # 写入文件
    with open(f'D:\\bilibili\\{fileName}.{mediaType}', mode='wb') as f:
        f.write(content)
    print(f"保存{mediaType}成功！")

def AvMerge(Mp3Name, Mp4Name, savePath):
    print("开始合并音频和视频.........")
    print(f"音频文件: {Mp3Name}")
    print(f"视频文件: {Mp4Name}")
    print(f"合并后文件保存路径: {savePath}")

    # 使用subprocess来调用ffmpeg，并重定向输出
    with open(os.devnull, 'w') as devnull:
        result = subprocess.run(
            ['ffmpeg', '-i', Mp4Name, '-i', Mp3Name, '-c:v', 'copy', '-c:a', 'aac', '-strict', 'experimental', savePath],
            stdout=devnull,
            stderr=devnull
        )

    print("合并成功！")
    os.remove(Mp3Name)
    os.remove(Mp4Name)

def main():
    url = input("请输入B站视频url地址:")
    videoInfo = parseResponse(url)
    # 获取视频标题
    fileName = videoInfo['videoTitle']
    # 下载并保存音频
    audioContent = getResponse(videoInfo['audioUrl']).content
    saveMedia(fileName, audioContent, 'mp3')
    # 下载并保存视频
    videoContent = getResponse(videoInfo['videoUrl']).content
    saveMedia(fileName, videoContent, 'mp4')

    Mp3Name = f'D:\\bilibili\\{fileName}.mp3'
    Mp4Name = f'D:\\bilibili\\{fileName}.mp4'
    savePath = f'D:\\bilibili\\merge_{fileName}.mp4'
    AvMerge(Mp3Name, Mp4Name, savePath)


if __name__ == '__main__':
    main()