批量爬取B站收藏夹封面ver2.0 Python 爬虫多线程

最新推荐文章于 2024-07-14 22:18:32 发布

偃笙

最新推荐文章于 2024-07-14 22:18:32 发布

阅读量556

点赞数 4

文章标签： java python 多线程 json

本文链接：https://blog.csdn.net/qq_25965165/article/details/108203540

版权

之前的版本：链接：批量爬取B站收藏夹封面 v1.0

批量爬取B站收藏夹封面ver2.0

相对之前版本更新内容：

※ 无需安装you-get库，可直接使用。

※ 提升封面下载速度，提升效率约90%

※ 尽量保证标题的完整度，仅去掉无法使用的符号(/\|<>?*:")

工具源码

from concurrent.futures import ThreadPoolExecutor
import threading
import requests
import json
import os


# 更正文件名
def correctFileName(name):
    n_list = list(name)
    for i in range(0, len(n_list)):
        index = 0
        for i in n_list:
            if (
                    i == '\\' or i == '/' or i == ':' or i == '*' or i == '?' or i == '\"' or i == '<' or i == '>' or i == '|'):
                n_list.pop(index)
            index = index + 1
    return ''.join(n_list)


# 解析指定收藏夹的ID，获取收藏夹信息，可指定获取多少页
def parseUrl(id, page):
    url = []
    # 添加收藏夹第一页信息地址
    url.append("https://api.bilibili.com/medialist/gateway/base/spaceDetail?media_id=" +

最低0.47元/天解锁文章

偃笙

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
3
评论
批量爬取B站收藏夹封面ver2.0 Python 爬虫多线程

之前的版本：链接：批量爬取B站收藏夹封面 v1.0批量爬取B站收藏夹封面ver2.0相对之前版本更新内容：※ 无需安装you-get库，可直接使用。※ 提升封面下载速度，提升效率约90%※ 尽量保证标题的完整度，仅去掉无法使用的符号(/\|<>?*:")工具源码from concurrent.futures import ThreadPoolExecutorimport threadingimport requestsimport jsonimport os#
复制链接

扫一扫