之前的版本:链接:批量爬取B站收藏夹封面 v1.0
批量爬取B站收藏夹封面ver2.0
相对之前版本更新内容:
※ 无需安装you-get库,可直接使用。
※ 提升封面下载速度,提升效率约90%
※ 尽量保证标题的完整度,仅去掉无法使用的符号(/\|<>?*:")
工具源码
from concurrent.futures import ThreadPoolExecutor
import threading
import requests
import json
import os
# 更正文件名
def correctFileName(name):
n_list = list(name)
for i in range(0, len(n_list)):
index = 0
for i in n_list:
if (
i == '\\' or i == '/' or i == ':' or i == '*' or i == '?' or i == '\"' or i == '<' or i == '>' or i == '|'):
n_list.pop(index)
index = index + 1
return ''.join(n_list)
# 解析指定收藏夹的ID,获取收藏夹信息,可指定获取多少页
def parseUrl(id, page):
url = []
# 添加收藏夹第一页信息地址
url.append("https://api.bilibili.com/medialist/gateway/base/spaceDetail?media_id=" +