最近学习编写了百度图片下载器,代码不长,思路也比较简单
其中主要的就是对所要爬取的界面进行分析,分析路径的构成,分析页面的布局,使用什么方法抽取想要的信息
import requests
import os
from uuid import uuid4
headers = {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_4) AppleWebKit/537.36 (KHTML, like Gecko) '
'Chrome/81.0.4044.138 Safari/537.36 ',
'Referer': 'https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=&st=-1&fm=result&fr=&sf'
'=1&fmq=1589288768118_R&pv=&ic=&nc=1&z=&hd=&latest=©right=&se=1&showtab=0&fb=0&width=&height=&face'
'=0&istype=2&ie=utf-8&sid=&word=%E5%8D%8E%E6%99%A8%E5%AE%87q%E5%9B%BE ',
'C