今天公司要求爬取图片,个人觉得下载一个一个点太麻烦,量也比较大
很多想写代码的初衷都是为了偷偷懒,省省时间和精力
刚开始爬因为需要的图片都是经过放大的图片,源码里面需要的图片链接都是存在于js里面(很多信息还是得看源码分析,不能只在页面检查,因为很多信息都是动态加载出来的),好了,话不多说,附上我写的代码:(有啥问题的可在下面评论,希望能帮到有需要的人)
# -*- coding: utf-8 -*-
'''使用谷歌界面浏览器'''
import scrapy
import requests, re, os
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import urllib.request
import random
import time
class ScrapyPictureSpider(scrapy.Spider):
name = 'ScrapyPicture'
start_urls = []
university_name = ['Memorial University of Newfoundland', 'University of British Columbia']
university_name_dict = {}
for university in university_name:
u =