requests爬虫请求头获得方法
以Chrome为例:
首先,随便打开一个网页,Ctrl+Shift+I:检查快捷键,之后会弹出一个窗口,类似于这样:
之后,第二步,按照屏幕中间的提示:Ctrl+R,窗口会加载一些网页元素,类似如下:
随便点击其中加载出来的一个东西,就会跳出来一个窗口,显示如下:
然后在这个新出现的窗口,往下划,就会看到,一个Request Headers,贴心的贴一张图:
Request Headers里面的User-Agent:…就是我们想要的请求头了,直接复制下来,然后变成python中字典的格式就使我们要的header了,
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36'}
header主要是requests中用来伪装浏览器请求网页用的。(爬虫其实就是爬取网页源码,然后提取我们想要的信息。)
请求头都一样的(对应机器不同会有变化),只要本机记录下来,以后就不用在找了,可以直接使用第一次找到的请求头。