本篇博客我们将爬取百度图片,输入搜索词,爬取与搜索词相关的图片。
首先打开搜狗图片https://pic.sogou.com/,比如搜索"猫",此时的URL如下:
如果仅凭借URL来爬取的话,URL中需要体现出搜索词信息以及页数信息,所以我们需要使用下面这个URL(至于这个URL是怎么得到的,目前我也不清楚,先照搬):
https://pic.sogou.com/pics?query={}&mode=1&start={}&reqType=ajax&reqFrom=result&tn=0
其中第一个{}替换为搜索词,第二个搜索词替换为页数信息。
首先搭建程序主体框架:
import time
import requests
import os
from requests import RequestException
import json
def get_page(u