HTTP请求头是我们每次向网络服务器发送请求时,想其传递的一组属性和配置信息。一下为七中常用的请求头:
1.Host
2.Connection
3.Accept
4.User-Agent
5.Referrer
6.Accept-Encoding
7.Accept-Language
我们可以上https://www.whatismybrowser.com/detect/what-http-headers-is-my-browser-sending来查看自己浏览器的请求头信息(网站还有其他关于浏览器的信息)。另外,我们可以利用requests模块修改自己的请求头,并用这个网站来测试自己的爬虫代码的请求头:
import requests
from bs4 import BeautifulSoup
session = requests.Session()
headers &#