简单理解HTTP协议

http协议又叫超文本传输协议,我们常用的网址http://指的就是这个东西。http协议是建立在TCP协议之上的,应用层的协议。那么我们来看看HTTP协议的内容都有哪些,我们可以使用网络调试助手,或直接在浏览器F12,网络窗口中查看,这里以访问www.baidu.com为例,在网络中我们看到访问https://www.baidu.com,他会有请求头和响应头,这就对应着浏览器的请求和百度服务器的响应(可以理解为浏览器问服务器要东西,服务器找到东西后给浏览器说:来给你)

我们来看一下请求头:
Host: www.baidu.com
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:70.0) Gecko/20100101 Firefox/70.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8
Accept-Language: zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2
Accept-Encoding: gzip, deflate, br
Connection: keep-alive
Cookie: BIDUPSID=2C504470B9C436713B46B79027C154D9; PSTM=1507623182; BDUSS=TFKQjFrZTVKT29ZcHdYc0daSVd5TDhSdEdPdDRGOTlmZ3l5MEpCQWZaTmJZY2hjRVFBQUFBJCQAAAAAAAAAAAEAAAD3kgEvwfrDqLrE19MAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAFvUoFxb1KBcQ; BAIDUID=756ECFE21DCD550C4D3CDA0609B40E02:FG=1; ispeed_lsm=2; BD_UPN=13314752; BDORZ=FFFB88E999055A3F8A630C64834BD6D0; COOKIE_SESSION=84423_0_7_4_6_12_0_2_7_3_0_2_254656_0_0_0_1573892059_0_1573976463%7C9%232156464_25_1573471020%7C9; BDRCVFR[Fc9oatPmwxn]=G01CoNuskzfuh-zuyuEXAPCpy49QhP8; BD_HOME=1; H_PS_PSSID=1460_21091_29568_29220
Upgrade-Insecure-Requests: 1

host:访问地址
User-Agent:这个字段表示支持的浏览器版本、型号。这个字段主要可以运用于爬虫与反爬虫中。爬虫没有做伪装则没有User-Agent,服务器只需检测User-Agent字段是否符合要求就可以阻挡大部分的爬虫。
Accept:支持接收的格式
Accept-Language:接收语言
Accept-Encoding:接收压缩格式
cookie:这个字段保存着用户最近通过该服务器浏览的页面信息,服务器检索这个字段就可以获取浏览信息,进而推测用户浏览倾向进行广告推荐

再看一下响应头:
HTTP/1.1 200 OK (or 404 not found)
Bdpagetype: 2
Bdqid: 0xe6956b1b0004d0b9
Cache-Control: private
Connection: Keep-Alive
Content-Encoding: gzip
Content-Type: text/html;charset=utf-8
Date: Mon, 18 Nov 2019 13:40:51 GMT
Expires: Mon, 18 Nov 2019 13:40:50 GMT
P3p: CP=" OTI DSP COR IVA OUR IND COM "
Server: BWS/1.1(百度特有的服务器格式)
Set-Cookie: BDRCVFR[Fc9oatPmwxn]=aeXf-1x8UdYcs; path=/; domain=.baidu.com
Set-Cookie: BDSVRTM=224; path=/
Set-Cookie: BD_HOME=1; path=/
Set-Cookie: H_PS_PSSID=1460_21091_29568_29220; path=/; domain=.baidu.com
Strict-Transport-Security: max-age=172800
Traceid: 1574084451063647309816615304163961917625
X-Ua-Compatible: IE=Edge,chrome=1
Transfer-Encoding: chunked

HTTP/1.1 200 OK :表示HTTP版本,200表示页面有内容 OK,也可能返回404,则表示没有找到页面。
Cache-Control:使用私有还是共有的cache
Content-Type: text/html;charset=utf-8:页面格式和编码方式
Date: Mon, 18 Nov 2019 13:40:51 GMT:响应时间
Set-Cookie:若在请求段没有cookie,则有的服务器会写Set-Cookie,浏览器接收到这个消息后会存储Set-Cookie到本地,下次访问作为Cookie传出。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值