----http get请求报文
----请求行-----
- GET / HTTP/1.1 => 请求方法(方式) 请求的资源路径 http协议的版本
----请求头----
- Host: www.baidu.com =>
服务器的主机ip地址和端口号,提示如果看不到端口号默认是80 - Connection: keep-alive =>
和服务端程序保存长连接,当客户端和服务端有一段时间(3-5)没有进行通信,那么服务器程序会主动向客户端断开连接 - Upgrade-Insecure-Requests: 1 => 让客户端请求不安全请求,以后要使用https
- User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88
Safari/537.36 =>
用户代理,客户端程序名称,当后续讲爬虫的时候可以根据是否有User-Agent进行反爬机制 - Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,/;q=0.8,application/signed-exchange;v=b3 =>
告诉服务端程序可以接受的数据类型 - Accept-Encoding: gzip, deflate =>
告诉服务端程序支持的压缩算法 - Accept-Language: zh-CN,zh;q=0.9,en;q=0.8 =>
告诉服务端程序支持的语言 - Cookie: