基于selenium爬取图片并转存到百度网盘

最新推荐文章于 2024-04-16 13:12:26 发布

郎总

最新推荐文章于 2024-04-16 13:12:26 发布

阅读量1.2k

点赞数

文章标签： python 爬虫百度网盘

本文链接：https://blog.csdn.net/whueratsjtuer/article/details/78680056

版权

初学python，花了一天时间鼓捣了一个爬虫。

#coding=utf-8
import requests
from bs4 import BeautifulSoup
import re
import string
from selenium import webdriver
import time

urlprelix = 'http://www.******.com/'

def webcrawler(max_page):
    page = 1
    driverold = webdriver.Chrome('/Applications/chromedriver')#chromedriver的路径
    driverold.get('https://pan.baidu.com/')#登录百度网盘生成cookie，后面可以导入新的网页，不用重复登录
    time.sleep(30)
    cookies_list = driverold.get_cookies()
    driverold.close()

    while page <= max_page:
        if page is 1:
            url = urlprelix
        else:
            url = urlprelix +'440_'+ str(page) + '.html'#每页的full url

        #添加header防反爬虫
        headers = {'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
        s

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

郎总

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基于selenium爬取图片并转存到百度网盘

初学python，花了一天时间鼓捣了一个爬虫。#coding=utf-8import requestsfrom bs4 import BeautifulSoupimport reimport stringfrom selenium import webdriverimport timeurlprelix = 'http://www.******.com/'def webcraw
复制链接

扫一扫