网络体系应用层之万维网、http协议

1、万维网概述

万维网以客户--服务器方式工作,万维网客户程序就是各式各样的浏览器,万维网文档所驻留的主机则运行服务器程序, 因此这个主机也称为万维网服务器。客户程序向服务器程序发出请求,服务器程序向客户程序送回客户所要的万维网文档。在一个客户程序主窗口上显示出的万维网文档称为页面(page)。因特网(Internet)提供的主要服务有万维网(WWW)、文件传输(FTP)、电子邮件E-mail、远程登录(Telnet)。

万维网使用统一资源定位符URL来标志万维网上的各种文档, 并使每一个文档在整个因特网的范围内具有唯一的标识符URL。万维网客户程序与万维网服务器程序之间的交互遵守严格的协议,这就是超文本传送协议HTTP。HTTP 是一个应用层协议,它使用TCP连接进行可靠的传送。万维网使用超文本标记语言HTM,使得万维网页面的设计者可以很方便地用链接从本页面的某处链接到因特网上的任何一个万维网页面,并且能够在自己的主机屏幕上将这些页面显示出来。最后,用户可使用搜索工具在万维网上方便地查找所需的信息。

2、统一资源定位符URL

统一资源定位符URL是用来表示从因特网上得到的资源位置和访问这些资源的方法。这里所说的“ 资源” 是指在因特网上可以被访问的任何对象,包括文件目录、文件、文档、图像、声音等,以及与因特网相连的任何形式的数据。由于访问不同对象所使用的协议不同, 所以URL还指出读取某个对象时所使用的协议。URL的一般形式由以下四个部分组成:

<协议>://<主机>:<端口>/<路径>

URL 的第一部分是最左边的协议,协议就是指出使用什么协议来获取该万维网文档,现在最常用的协议就是http (超文本传送协议HTTP),其次是ftp (文件传送协议FTP)。在协议后面是规定必须写上的格式://,不能省略。第二个部分是主机,它指出这个万维网文档是在哪一个主机上,这里的主机就是指该主机在因特网上的域名。第三和第四部分是端口和路径, 有时可省略。比如:http://www.baidu.com

对于万维网的网点的访问要使用HTTP协议,HTTP的默认端口号是80, 通常可省略。若省略路径,则URL就指到该域名上的主页。

 

3、超文本传送协议HTTP

HTTP 协议定义了浏览器(即万维网客户进程)怎样向万维网服务器请求万维网文档,以及服务器怎样把文档传送给浏览器。它是万维网上能够可靠地交换文件(包括文本、声音、图像等各种多媒体文件)的重要基础。

每个万维网网站都有一个服务器进程,它不断地监听TCP 的端口80,以便发现是否有浏览器向它发出连接建立请求。一旦监听到连接建立请求并建立了TCP 连接之后,浏览器就向万维网服务器发出浏览某个页面的请求(浏览器在第三次握手时将http请求报文作为TCP数据报的数据部分发送过去),服务器接着就返回所请求的页面作为响应。最后,TCP 连接就被释放了。在浏览器和服务器之间的请求和响应的交互, 必须按照规定的格式和遵循一定的规则,这些格式和规则就是超文本传送协议HTTP。

情景假设:用户点击链接,该链接指向清华大学院系设置页面:http:/ /www.tsinghua.edu.cn/chn/yxsz/index.htm,下面具体地说明在用户点击鼠标后所发生的几个事件:

(1 )浏览器分析链接指向页面的URL。
(2)浏览器向DNS请求解析 www.tsinghua.edu.cn 的 ip 地址。
(3)域名系统DNS解析出清华大学服务器的 ip 地址为166.111.4.100。
(4)浏览器与服务器建立TCP连接(在服务器端IP地址是166.111.4.100, 端口是80)。
(5)浏览器发出取文件命令:GET /chn/yxsz/index.html
(6)服务器 www.tsinghua.edu.cn 给出响应,把文件index.htm发送给浏览器。
(7)释放TCP连接。
(8 )浏览器显示“ 清华大学院系设置” 文件index.htm中的所有文本。

浏览器在下载文件时,可以设置为只下载其中的文本部分,要想查看其它内容可以用鼠标点击未显示完全的小图标,而每点击一次鼠标,就重复执行一次类似于上面的8个步骤。

HTTP使用了面向连接的TCP作为运输层协议,保证了数据的可靠传输,HTTP不必考虑数据在传输过程中被丢弃后又怎样被重传。HTTP协议本身是无连接的,这就是说,虽然HTTP 使用了TCP 连接,但通信的双方在交换HTTP报文之前不需要先建立HTTP连接。HTTP协议是无状态的:同一个客户第二次访问同一个服务器上页面时,服务器的响应与第一次被访问时的相同,服务器并不记得曾经访问过的这个客户,也不记得为该客户曾经服务过多少次。

 

3.1、代理服务器

代理服务器是一种网络实体,它又称为万维网高速缓存。代理服务器把最近的一些请求和响应暂存在本地磁盘中。当新请求到达时,若代理服务器发现这个请求与暂时存放的请求相同,就返回暂存的响应,而不需要按URL的地址再次去因特网访问该资源。代理服务器可在客户端或服务器端工作,也可在中间系统上工作。代理服务器能有效减小访问因特网的时延,提高上网速度。

 

3.2、cookie

当页面浏览器允许使用cookie时,该网站的服务器就为用户产生一个唯一的识别码,并以此作为索引在服务器的后端数据库中产生一个项目。接着在给用户的HTTP响应报文中添加一个叫做Set-cookie的首部行,Set-cookie后面有cookie的键值对。浏览器收到响应时就会将在存储cookie文件里在对应着这个特定域名的内容里将传过来的cookie键值对存储起来。在以后的每次往该服务器发http请求时,浏览器都会自动在http请求头的cookie字段里添加进这个cookie键值对,服务器通过接收到的cookie值就能知道是同一个用户的行为,以此达到追踪效果。

//后台代码
response.setHeader('Set-Cookie','token=cowshield');

http协议是无状态的,浏览器发送请求,服务器返回响应报文给浏览器,响应的Response Header中的Set-Cookie就是告诉浏览器为当前页面设置cookie。比如:响应头中有Set-Cookie: username=JasonChi,那么浏览器会在当前页面所在域名设置cookie字符串。当浏览器再次发送请求时,浏览器默认会自动将cookie中的字符串放在请求头中的Cookie项中发送给Web服务器。

 

4、HTTP报文结构

HTTP有两类报文:
(1) 请求报文一一从客户向服务器发送请求报文
(2) 响应报文一一从服务器到客户的回答

 

HTTP 请求报文和响应报文都是由三个部分组成。可以看出,这两种报文格式的区别就是开始行不同。
(1)开始行: 用于区分是请求报文还是响应报文。在请求报文中的开始行叫做请求行(Request-Line),而在响应报文中的开始行叫做状态行(Status-Line)。
(2)首部行: 用来说明浏览器、服务器或报文主体的-些信息。在每一个首部行中都有首部字段名和它的值。首部行应该就是对应着常说的请求头(Request Headrer)、响应头(Response Header)
(3)实体主体(entity body): 在请求报文中可能不会用到这个字段, 而在响应报文中也可能没有这个字段。

 

4.1、http 请求报文

请求报文的第一行“请求行” 只有三个内容,即方法,请求资源的URL,以及HTTP的版本。

比如:上例中链接到“ 清华大学院系设置” 页面的请求行:GET http://www.tsinghua.edu.cη/chn/yxsz/index.htm HTTP/1.1

请求报文参数说明:

请求行:GET /chn/yxsz/index. htm HTTP /1. 1 {请求行使用了相对URL}

请求头参数:

Accept-Encoding: gzip, deflate 浏览器支持的压缩编码是 gzip 和 deflate。              Accept-Charset: GB2312,utf-8;q=0.7,*;q=0.7  浏览器支持的字符编码分别是 GB2312、utf-8 和任意字符

Accept-Language: zh-cn,zh;q=0.5 浏览器支持的语言分别是中文和简体中文             Accept: text/html,application/xhtml+xml,application/xml 浏览器支持的 MIME 类型分别是 text/html、application/xhtml+xml、application/xml

Host: www.tsinghua.edu.cn {此行是首部行的开始。这行给出主机的域名}             Connection: close {告诉服务器发送完请求的文档后就可释放连接}

User-Agent: Mozilla/5.0 {表明用户代理是使用Netscape浏览器}                   Referer:用户目前所处页面的URL

 Content-type:application/json    告诉服务器我们发送的请求信息的格式

4.3、http响应报文

响应报文的第一行就是状态行。状态行包括三项内容,即HTTP的版本,状态码,以及解释状态码的简单短语。

状态码(Status-Code)都是三位数字的, 分为5大类共33种:

lxx表示通知信息的, 如请求收到了或正在进行处理。
2xx表示成功, 如接受或知道了。
3xx表示重定向, 如要完成请求还必须采取进一步的行动。
4xx表示客户的差错, 如请求中有错误的语法或不能完成。

5xx表示服务器的差错, 如服务器失效无法完成请求。

常见的状态码:

200 请求成功

302 重定向
304 页面缓存

403 没有权限访问
404 页面不存在

500 后端程序报错

具体的状态码查看:http://www.runoob.com/http/http-status-codes.html

 

4.4、HTTP中请求头和响应头的各个字段及含义

参考:https://www.cnblogs.com/widget90/p/7650890.html

4.5、Content-Type 字段各个值的含义

参考:https://www.cnblogs.com/cyanlong/p/5726793.html

 

5、HTTP协议各个版本的比较(http0.9、1.0、1.1、2.0)

参考:https://www.cnblogs.com/andashu/p/6441271.html#top

https://blog.csdn.net/qq_22238021/article/details/81197157

 

转载于:https://www.cnblogs.com/wenxuehai/p/10393590.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值