Python爬取B站视频

置顶人行道出风头

已于 2024-02-12 17:07:05 修改

阅读量377

点赞数 5

文章标签： python 音视频开发语言

于 2024-02-12 16:55:02 首次发布

本文链接：https://blog.csdn.net/Wzc20100502/article/details/136101905

版权

老规矩，先上代码：

import tkinter as tk
import requests
import re
import json
import pprint
import subprocess
import os
import random


def trying():
    Q = w.get()
    if 'https://www.bilibili.com/' in Q:
        reg()
    else:
        n['text'] = '请检查输入'

def reg():
    Q = w.get()
    D = str(random.uniform(-99999999999999999, 999999999999999999999999999999))
    E = '\\' + D

    def askURL(url):

        head = {
            'referer':
                'https://www.bilibili.com/',
            'user-agent':
                'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.124 Safari/537.36 Edg/102.0.1245.44'
        }
        response = requests.get(url=url, headers=head)
        return response

    def getVideoInfo(response):
        findUrl = re.compile('<script>window.__playinfo__=(.*?)</script>')
        VideoInfo = re.findall(findUrl, response.text)[0]
        jsonData = json.loads(VideoInfo)
        return jsonData

    def download(jsonData):
        path = "视频"
        if not os.path.isdir(path):
            os.mkdir(path)
        audioURL = jsonData['data']['dash']['audio'][0]['baseUrl']
        videoURL = jsonData['data']['dash']['video'][0]['baseUrl']
        print(audioURL)
        print(videoURL)

        audioContent = askURL(audioURL).content
        with open(path + './' + E + '.mp3', mode='wb') as f:
            f.write(audioContent)
        videoContent = askURL(videoURL).content
        with open(path + './' + E + '.mp4', mode='wb') as f:
            f.write(videoContent)

    def title_find (response):
        findUrl = re.compile('title=(.*?) class')
        VideoInfo = re.findall(findUrl, response.text)[0]
        ## 字符串转换为python的数据类型，便于后续操作
        jsonData = json.loads(VideoInfo)
        return jsonData

    def audioAndVideo(audioFile, videoFile):
        load = os.getcwd()
        outfile_name = './output.mp4'
        cmd = load + fr'\ffmpeg\bin\ffmpeg.exe -i {audioFile} -i {videoFile} -acodec copy -vcodec copy {outfile_name}'
        print(cmd)
        subprocess.call(cmd, shell=True)

    def rename_files(dir_path, old_name, new_name):
        for root, dirs, files in os.walk(dir_path):
            for file in files:
                if file == old_name:
                    old_file_path = os.path.join(root, file)
                    new_file_path = os.path.join(root, new_name)
                    os.rename(old_file_path, new_file_path)

    def main():
        load = os.getcwd()
        html = askURL(url=Q)
        jsonData = getVideoInfo(html)
        pprint.pprint(jsonData)
        download(jsonData)
        audioAndVideo(r'' + load + '\视频' + E + '.mp3', r'' + load + '\视频' + E + '.mp4')
        title_name = title_find(html)
        print(title_name)
        directory = load
        old_filename = 'output.mp4'
        new_filename = title_name+'.mp4'
        rename_files(directory, old_filename, new_filename)
        n['text'] = '文件放置在'+load
        pass

    if __name__ == '__main__':
        main()

f1 = tk.Tk()
f1.geometry("250x100")
f1.resizable(False, False)
f1.title("B站")
w =tk.Entry(f1)
w.place(x=90, y=20)
z = tk.Label(f1, text="路径")
z.place(x=30, y=20)
a = tk.Button(f1, text="确认", command=trying, width=40, height=1)
a.pack(side="bottom")
n = tk.Label(f1, text=" ")
n.pack(side="bottom")
tk.mainloop()

其中，ffmpeg需下载，并放到和文件一个目录下，地址：

链接：https://pan.baidu.com/s/1dPZsU30JJN8XXbE7WrMEvQ?pwd=leez
提取码：leez