一、前期准备
(一).我们要爬取的页面
1,我们要爬取的网站为:https://www.doutula.com/photo/list/?page=1
2,获取请求头,来模拟浏览器浏览,不让网站直接就暴露我们是python,怎么获取请求头呢,很简单,按f12(右键检查)
很好,你已经会了请求头,那么现在就开始用工具把。
3,所以我们前期的代码是这样的:
def get_url(url):
#我们的请求头信息
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36'
}
#定义一个main函数
def main():
for x in range(1,10): #定义一个循环,设置我们要爬取的页数
url &