B站相簿小爬虫

最新推荐文章于 2024-07-15 11:23:54 发布

蓝凉

最新推荐文章于 2024-07-15 11:23:54 发布

阅读量996

点赞数

分类专栏：学习过程

本文链接：https://blog.csdn.net/weixin_43270546/article/details/83620372

版权

学习过程专栏收录该内容

4 篇文章 0 订阅

订阅专栏

今天下午自闭
终于是没有什么困难的写出了一个自己觉得还行的爬虫

import requests
import re
heders = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36'
}
def url(number):
    urls = []
    for i in range(number):
        url = 'https://api.vc.bilibili.com/link_draw/v2/Doc/list?category=all&type=hot&page_num={}&page_size=20'.format(i)
        urls.append(url)
    return urls
def getone(num):
    picture_url = []
    for a in url(num):
        i = 0
        res = requests.get(a,headers = heders).text
        wtf = '"img_src":"(.*?)"'
        hahaha = re.findall(wtf,res,re.S)
        for b in hahaha:
            picture_url.append(hahaha[i])
            i = i + 1
    return picture_url
def download(num):
    t = 0
    for a in getone(num):

        www = requests.get(a,headers = heders)
        with open('E:\\for_bilibili_picture\\{}.jpg'.format(t),'wb')as f:
            f.write(www.content)
        t = t + 1
download(20)

有很多东西还是不会功能也很简单
（谁能想到是因为bilibili模拟登陆不会，才发现Ajax也可以的）
接下来也要准备探索反反爬虫和昨天说得多线任务了
就像这样！

蓝凉

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
B站相簿小爬虫

今天下午自闭终于是没有什么困难的写出了一个自己觉得还行的爬虫import requestsimport reheders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537....
复制链接

扫一扫