Pyhton3 B站下载指定up主所有视频并归类存放（源码）

最新推荐文章于 2024-08-09 15:20:32 发布

蓝一潇、薛定谔的猫

最新推荐文章于 2024-08-09 15:20:32 发布

阅读量3.2k

点赞数 2

分类专栏： python基础笔记爬虫文章标签： b站下载 b站爬虫 b站视频视频下载 python爬虫

本文链接：https://blog.csdn.net/weixin_42744102/article/details/105260428

版权

python基础笔记同时被 2 个专栏收录

39 篇文章 4 订阅

订阅专栏

爬虫

2 篇文章 0 订阅

订阅专栏

B站视频下载器

给大家分享两个python3脚本，第一个脚本输入up主的id就可以下载他/她的全部视频（包括多分p视频）且分类存放；第二个脚本输入av/bv号就可以直接下载指定视频（同样包括多分p视频），这两个脚本都是基于you_get实现的。都是复制了就可以用的，非常方便。
源码都已经上传至github，之后修复bug或有新的功能都会及时更新（非常欢迎star或fork）：https://github.com/Eathoublu/BilibiliUserDownloader
鸣谢知乎以及CSDN的各位大佬提供了av号与bv号互转的算法，这在实现过程中起到了至关重要的作用。源码和使用方法如下：

使用方法

环境：python3
需要安装万能的you_get工具包 pip3 install you_get

bilibili_downloader.py：按照up主来下载视频（适用于多分p视频）

参照main函数中的方法：

实例化Manager类，传入一个prefix（即前缀路径）。
调用Manager的run方法，传入一个用户id（即为希望下载的up主的id）
enjoy
注：该工具附带了断点续传功能，在run方法中加入整形参数kstart即可从指定位置继续传输。e.x.假如一个up主有20个视频，你传到第10个的时候断开了，那么屏幕上会显示10/20，那么接下来重新开始运行脚本时，只需传入kstart=10即可从断开的地方继续传输。

bilibili_downloader4SingleVideo.py：按照av号（或者bv号）来下载单独的视频（同样适用于多分p视频）

这是一个补充的脚本，比第一个稍微实用一点。
main函数中几乎一目了然了，方法如下：

实例化Manager。
调用Manager的run方法，参数vid是av号或者bv号，mode：av号就填‘av’反之亦然，prefix是路径，kstart是断点续传，与第一个工具使用方法一致。

源码

bilibili_downloader.py

import requests
import re
import os
import json
import sys
from you_get import common as you_get

class BilibiliDownloader(object):
    def __init__(self):
        pass
    @staticmethod
    def run(dic, urll):
        for u in urll:
            # try:
            sys.argv = ['you-get', '-o', dic, u]
            you_get.main()
            # except Exception as e:
            #     print(e)
        return

class BilibiliVideoManager(object):

    def __init__(self):
        self.rule = re.compile('<span class="cur-page">.*?/(.*?)</span></div>', re.S)
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36',
        }
        self.trule = re.compile('eta="true">(.*?)_哔哩哔哩', re.S)

    @staticmethod
    def genurl(url, page):
        urls = []
        urls.append(url)
        for idx in range(1, page):
            urls.append('{}?p={}'.format(url, idx+1))
        return urls

    def run(self, bv):

        # url = 'https://api.bilibili.com/x/space/arc/search?mid=12473905&ps=30&tid=0&pn=1&keyword=&order=pubdate&jsonp=jsonp'
        # url = 'https://www.bilibili.com/video/BV1Ez411b7jR'
        url = 'https://www.bilibili.com/video/{}'.format(bv)
        req = requests.get(url, headers=self.headers)
        content = str(req.content, 'utf8')
        wholep = self.rule.findall(content)
        if wholep:
            return self.genurl(url, int(wholep[0]))
        return [url, ]

    def gettitle(self, url):
        c = str(requests.get(url, headers=self.headers).content, 'utf8')
        title = self.trule.findall(c)[0]
        return title

class BilibiliUserManager(object):
    def __init__(self, prefix):
        # 12473905
        self.prefix = prefix
        self.burl2 = 'https://space.bilibili.com/{}'
        self.i2url = 'https://api.bilibili.com/x/relation/stat?vmid={}'
        self.burl = 'https://api.bilibili.com/x/space/acc/info?mid={}&jsonp=jsonp'
        self.surl = 'https://api.bilibili.com/x/space/arc/search?mid={}&pn={}&ps=25&jsonp=jsonp'
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36',
        }
        self.uid = None
        self.alphabet = 'fZodR9XQDSUm21yCkr6zBqiveYah8bt4xsWpHnJE7jL5VG3guMTKNPAwcF'

    def run(self, uid):
        uid = str(uid)
        self.uid = uid
        abspath = self.prefix + '/' + uid
        if not os.path.exists(abspath):
            os.mkdir(abspath)
            os.mkdir(abspath+'/profile')
            os.mkdir(abspath+'/video')
        jsoninfo0 = str(self.request(self.i2url.format(uid)), 'utf8')
        # print(jsoninfo0)
        jif = json.loads(jsoninfo0)
        follower = jif['data']['follower']
        following = jif['data']['following']

        jsoninfo1 = str(self.request(self.burl.format(uid)), 'utf8')
        jif = json.loads(jsoninfo1)
        name = jif['data']['name']
        sex = jif['data']['sex']
        avataru = jif['data']['face']
        rank = jif['data']['rank']
        level = jif['data']['level']
        birthday = jif['data']['birthday']
        sign = jif['data']['sign']
        with open(abspath+'/profile/basic.txt', 'w') as f:
            f.write('name: {} sex:{} rank:{} level:{} birthday:{} sign:{} follower:{} following:{}'.format(name, sex, rank, level, birthday, sign, follower, following))
            f.close()
        avatar = self.request(avataru)
        with open(abspath+'/profile/avatar.jpg', 'wb') as f:
            f.write(avatar)
            f.close()

        with open(abspath+'/profile/source.txt', 'w') as f:
            f.write('{};;{}'.format(jsoninfo0, jsoninfo1))
            f.close()

    def searchlist(self):
        videol = []
        pn = 1
        while True:
            sres = str(self.request(self.surl.format(self.uid, pn)), 'utf8')
            sl = self.parselist(json.loads(sres))
            if sl:
                videol += sl
            else:
                break
            pn += 1
        return videol

    def dec(self, x):
        r = 0
        for i, v in enumerate([11, 10, 3, 8, 4, 6]):
            r += self.alphabet.find(x[v]) * 58 ** i
        return (r - 0x2_0840_07c0) ^ 0x0a93_b324

    def enc(self, x):
        x = (x ^ 0x0a93_b324) + 0x2_0840_07c0
        r = list('BV1**4*1*7**')
        for v in [11, 10, 3, 8, 4, 6]:
            x, d = divmod(x, 58)
            r[v] = self.alphabet[d]
        return ''.join(r)

    @staticmethod
    def parselist(jso, mode='a'):
        vlist = jso['data']['list']['vlist']
        idl = []
        if not vlist:
            return False
        for v in vlist:
            if mode=='b':
                idl.append(v['bvid'])
            else:
                idl.append(v['bvid'])
        return idl

    def request(self, url):
        return requests.get(url, headers=self.headers).content

class Manager(object):
    def __init__(self, prefix='.'):
        self.prefix = prefix
        self.bum = BilibiliUserManager(prefix=prefix)
        self.bvm = BilibiliVideoManager()
        self.bd = BilibiliDownloader()
        self.fall_list = []

    def run(self, uid, startk=None):
        self.fall_list = []
        self.bum.run(uid=uid)
        vlist= self.bum.searchlist()
        vbase = self.prefix+'/'+str(uid)+'/video/'
        k = 0
        tk = len(vlist)
        for v in vlist:
            k += 1
            if startk:
                if k < startk:
                    continue
            print('{}/{}'.format(k, tk))

            svl = self.bvm.run(v)
            tit = str(self.bvm.gettitle(svl[0])).replace('/', '\\')
            if os.path.exists(vbase+str(k)+'_'+tit):
                pass
            else:
                os.mkdir(vbase+str(k)+'_'+tit)
            try:
                # print(svl)
                self.bd.run(vbase+str(k)+'_'+tit, svl)
            except:
                print('Fall one. k={}, svl={}'.format(k, svl))
                self.fall_list.append(svl)

        if self.fall_list:
            print('All Fall:{}'.format(self.fall_list))
        print('Finish!')

if __name__ == '__main__':

    m = Manager(prefix='.')
    m.run(uid='')

bilibili_downloader4singlevideo.py

import requests
import re
import os
import json
import sys
from you_get import common as you_get

class BilibiliDownloader(object):
    def __init__(self):
        pass
    @staticmethod
    def run(dic, urll, kstart=None):
        # kstart is the last number printed on the screen.
        k = 0
        kt = len(urll)
        for u in urll:
            k += 1
            if kstart:
                if k <= kstart:
                    continue
            try:
                sys.argv = ['you-get', '-o', dic, u]
                you_get.main()
            except Exception as e:
                print(e)
                print('*Loss one. The url is:{}'.format(u))
            print('{}/{} done.'.format(k, kt))
        return

class BilibiliVideoManager(object):

    def __init__(self):
        self.rule = re.compile('<span class="cur-page">.*?/(.*?)</span></div>', re.S)
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36',
        }
        self.trule = re.compile('eta="true">(.*?)_哔哩哔哩', re.S)
        self.alphabet = 'fZodR9XQDSUm21yCkr6zBqiveYah8bt4xsWpHnJE7jL5VG3guMTKNPAwcF'

    @staticmethod
    def genurl(url, page):
        urls = []
        urls.append(url)
        for idx in range(1, page):
            urls.append('{}?p={}'.format(url, idx+1))
        return urls

    def dec(self, x):
        r = 0
        for i, v in enumerate([11, 10, 3, 8, 4, 6]):
            r += self.alphabet.find(x[v]) * 58 ** i
        return (r - 0x2_0840_07c0) ^ 0x0a93_b324

    def enc(self, x):
        x = (x ^ 0x0a93_b324) + 0x2_0840_07c0
        r = list('BV1**4*1*7**')
        for v in [11, 10, 3, 8, 4, 6]:
            x, d = divmod(x, 58)
            r[v] = self.alphabet[d]
        return ''.join(r)

    def run(self, vid, mode='bv'):
        if mode == 'bv':
            vid = 'av'+str(self.dec(vid))
        url = 'https://www.bilibili.com/video/{}'.format(vid)
        req = requests.get(url, headers=self.headers)
        content = str(req.content, 'utf8')
        wholep = self.rule.findall(content)
        if wholep:
            return self.genurl(url, int(wholep[0]))
        return [url, ]

    def gettitle(self, url):
        c = str(requests.get(url, headers=self.headers).content, 'utf8')
        title = self.trule.findall(c)[0]
        return title

class Manager(object):
    def __init__(self):
        self.bd = BilibiliDownloader()
        self.bvm = BilibiliVideoManager()

    def run(self, vid, prefix='.', mode='bv', kstart=None):
        urll = self.bvm.run(vid, mode)
        tit = self.bvm.gettitle(urll[0])
        self.bd.run(dic=prefix+'/'+tit, urll=urll, kstart=kstart)

if __name__ == '__main__':

    m = Manager()
    m.run('av91882697', mode='av', prefix='.')