注:内容参考湖科大教书匠《深入浅出计算机网络》
应用层概述
应用层是计算机网络体系结构的最顶层,是设计和建立计算机网络的最终目的,也是计算机网络中发展最快的部分。
客户/服务器方式和对等方式
网络应用程序运行在处于网络边缘的不同的端系统上,通过彼此间的通信来共同完成某项任务。
开发一种新的网络应用,首先要考虑的问题就是网络应用程序在各种端系统上的组织方式和它们之间的关系。目前流行的主要有以下两种:
- 客户/服务器(C/S)方式
- 对等(P2P)方式
客户/服务器(C/S)方式
客户和服务器是指通信中所涉及的两个应用进程。
客户/服务器方式所描述的是进程之间服务和被服务的关系。
客户是服务请求方,服务器是服务提供方。
服务器总是处于运行状态,并等待客户的服务请求。
基于C/S方式的应用服务通常是服务集中型的,即应用服务集中在网络中比客户计算机少得多的服务器计算机上。
万维网WWW 、电子邮件、文件传输FTP等熟悉的网络应用采用的都是C/S 方式。
对等(P2P)方式
在P2P方式中,没有固定的服务请求者和服务提供者,分布在网络边缘各端系统中的应用进程是对等的,被称为对等方。
对等方相互之间直接通信,每个对等方既是服务的请求者,又是服务的提供者。
基于P2P的应用是服务分散型的,因为服务不是集中在少数几个服务器计算机中,而是分散在大量对等计算机中,
P2P方式的最突出特性之一就是它的可扩展性。因为系统每增加一个对等方,不仅增加的是服务的请求者,同时也增加了服务的提供者,系统性能不会因规模的增大而降低。
动态主机配置协议
动态主机配置协议DHCP的作用
使用TCP/IP协议栈的主机,需要配置相关的网络参数,才能与因特网上的主机进行通信,这些网络参数一般包括以下几类:
- IP地址。
- 子网掩码。
- 默认网关的IP地址。
- 域名服务器的IP地址。
网络添加一台DHCP服务器,在该服务器中设置好可为网络中其他各主机配置的网络参数。
网络中各主机开机后自动启动DHCP程序,向DHCP服务器请求自己的网络配置参数。这样,网络中的各主机就可以从DHCP服务器自动获取自己的网络配置参数,而不用人工配置。
动态主机配置协议(DHCP)可为计算机自动配置网络参数,使得计算机“即插即联网”。
动态主机配置协议DHCP的基本工作过程
DHCP报文的封装
DHCP是TCP/IP体系结构应用层中的协议,它使用运输层的UDP所提供的服务。
DHCP的基本工作过程
- 当启用主机的DHCP后,DHCP客户将发送DISCOVER报文
报文封装了事务ID,DHCP客户端的MAC地址。
该报文的IP数据报的源IP地址为0.0.0.0
,因为主机目前还未分配到IP地址,因此使用该地址来代替;目的IP地址为广播地址255.255.255.255
,使用广播发送,所有设备都会收到该IP数据报,并对其层层解封,解封出封装有DHCP发现报文的UDP用户数据报。
- 对于DHCP客户,其应用层没有监听该UDP用户数据报目的端口号67的进程(DHCP服务器进程),丢弃。
- 对于DHCP服务器,接受该DHCP发现报文并做出响应。
- DHCP服务器收到DHCP发现报文后,查找自己的数据库否有针对该MAC地址的配置信息。
如果有,则使用这些配置信息来构建并发送DHCP提供报文(OFFER);如果没有,则采用默认配置信息来构建并发送DHCP提供报文。
封装DHCP提供报文的IP数据报的源IP地址为DHCP服务器的IP地址,目的地址仍为广播地址(主机目前没有配置IP地址,为了使主机可以收到)。
DHCP客户会根据DHCP提供报文中的事务ID来判断该报文是否是自己所请求的报文。
DHCP的基本工作过程如下:
(1)DHCP客户寻找DHCP服务器
(2)DHCP服务器向DHCP客户提供IP地址租用。
(3)DHCP客户接收IP地址租约
(4)DHCP服务器确认IP地址租约
(5)DHCP客户进行IP地址续约
(6)DHCP客户可以随时解除IP地址租约。
DHCP中继代理
各主机分布在不同的网络无法可以通过DHCP来自动获取网络配置参数,因为该网络中的主机广播发送DHCP发现报文,但该广播报文不会被路由器转发,而是被丢弃!
解决上述问题的方法:给该路由器配置DHCP服务器的IP地址并使之成为DHCP中继代理,该网络中的各主机就可以通过DHCP来自动获取到网络配置参数了。当成为DHCP中继代理的路由器收到广播的DHCP发现报文后,会将其单播转发给DHCP服务器。
使用DHCP中继代理的主要原因是我们并不愿意在每一个网络上都设置一个DHCP服务器,因为这样会使DHCP服务器的数量太多。
域名系统
域名系统的作用
因特网的域名结构
因特网采用层次树状结构的域名结构。
域名的结构由若干个分量组成,各分量之间用“点”隔开,分别代表不同级别的域名。
域名系统既不规定一个域名需要包含多少个下级域名,也不规定每一级的域名代表什么意思。
各级域名由其上一级的域名管理机构管理,而最高的顶级域名则由ICANN进行管理。
因特网上的域名服务器
根域名服务器
根域名服务器是最高层次的域名服务器。
每个根域名服务器都知道所有的顶级域名服务器的域名及其IP地址。
根域名服务器通常并不直接对域名进行解析,而是返回该域名所属顶级域名的顶级域名服务器的IP地址。
顶级域名服务器
顶级域名服务器负责管理在该顶级域名服务器注册的所有二级域名。
当收到DNS查询请求时就给出相应的回答,可能是最后的结果,也可能是下一级权限域名服务器的IP地址。
权限域名服务器
权限域名服务器负责管理某个区的域名。
每一个主机的域名都必须在某个权限域名服务器处注册登记。
权限域名服务器知道其管辖的域名与IP地址的映射关系。权限域名服务器还知道其下级域名服务器的地址。
本地域名服务器
本地域名服务器不属于上述的域名服务器的等级结构。
当一个主机发出DNS请求报文时,这个报文就首先被送往该主机的本地域名服务器。
本地域名服务器起着代理的作用,会将该报文转发到上述的域名服务器的等级结构中。
因特网的域名解析过程
递归查询
由于递归查询对于被查询的域名服务器负担太大,通常采用以下模式:
- 从请求主机到本地域名服务器的查询是递归查询
- 其余的查询是迭代查询
迭代查询
文件传送协议
文件传送协议FTP的作用
文件传送协议(FTP)是因特网上使用得最广泛的文件传送协议。
FTP提供交互式的访问,允许客户指明文件的类型与格式(如指明是否使用ASCII码),并允许文件具有存取权限(如访问文件的用户必须经过授权,并输入有效的口令)。
FTP屏蔽了各计算机系统的细节,因而适合于在异构网络中任意计算机之间传送文件。
根据应用需求的不同,可使用普通个人计算机作为FTP服务器。
在FTP服务器上可使用第三方FTP服务器软件或操作系统自带的FTP服务器软件来创建FTP站点。
文件传送协议FTP的基本工作原理
FTP采用客户/服务器方式,有以下两种工作模式:主动模式和被动模式。
主动模式
建立数据通道时,FTP服务器主动连接FTP客户。
控制连接在整个会话期间一直保持打开,用于传送FTP相关控制命令。
数据连接用于文件传输,在每次文件传输时才建立,传输结束就关闭。
被动模式
建立数据通道时,FTP服务器被动等待FTP客户的连接。
电子邮件
电子邮件的作用
电子邮件E-mail是因特网上最早流行的一种应用,并且仍然是当今因特网上最重要、最实用的应用之一。
电子邮件系统的组成
电子邮件系统采用客户/服务器方式。
电子邮件系统的三个主要组成构件:用户代理,邮件服务器,以及电子邮件所需的协议。
用户代理是用户与电子邮件系统的接口,又称为电子邮件客户端软件。
邮件服务器是电子邮件系统的基础设施。因特网上所有的因特网服务提供者ISP都有邮件服务器,其功能是发送和接收邮件,同时还要负责维护用户的邮箱。
协议包括邮件发送协议(例如SMTP)和邮件读取协议(例如POP3,IMAP)。
简单邮件传送协议SMTP的基本工作过程
电子邮件的信息格式
一个电子邮件有信封和内容两部分。而内容又由首部和主体两部分构成。
多用途因特网邮件扩展
SMTP协议只能传送ASCII码文本数据,不能传送可执行文件或其他的二进制对象。
SMTP不能满足传送多媒体邮件的需要。并且许多其他非英语国家的文字也无法用SMTP传送。
为了解决该问题,提出了多用途因特网邮件扩展MIME。
MIME不仅仅用于SMTP,也用于后来的同样面向ASCII字符的HTTP。
常用的邮件读取协议
邮局协议(POP)
POP3是其第三个版本,是因特网正式标准。
非常简单、功能有限的邮件读取协议。
用户只能以下载并删除方式或下载并保留方式从邮件服务器下载邮件到用户方计算机。
不允许用户在邮件服务器上管理自己的邮件(例如创建文件夹,对邮件进行分类管理等)。
因特网邮件访问协议(IMAP)
IMAP4是其第四个版本,是因特网建议标准。
功能比POP3强大的邮件读取协议。
用户在自己的计算机上就可以操控邮件服务器中的邮箱,就像在本地操控一样,因此IMAP是一个联机协议。
注:POP3(端口号110)和IMAP4(端口号143)都采用基于TCP连接的客户/服务器方式。
基于万维网的电子邮件
通过浏览器登录(提供用户名和口令)邮件服务器万维网网站就可以撰写、收发、阅读和管理电子邮件。
用户计算机无需安装专门的用户代理程序,只需要使用通用的万维网浏览器。
邮件服务器网站通常都提供非常强大和方便的邮件管理功能,用户可以在邮件服务器网站上管理和处理自己的邮件,而不需要将邮件下载到本地进行管理。
万维网
万维网概述
万维网(WWW)并非某种特殊的计算机网络。它是一个大规模的、联机式的信息储藏所,是运行在因特网上的一个分布式应用。
万维网利用网页之间的超链接将不同网站的网页链接成一张逻辑上的信息网。
目前比较流行的浏览器:
浏览器最重要的部分是渲染引擎,也就是浏览器内核。负责对网页内容进行解析和显示。
不同的浏览器内核对网页内容的解析也有不同,因此同一网页在不同内核的浏览器里的显示效果可能不同;网页编写者需要在不同内核的浏览器中测试网页显示效果。
统一资源定位符
为了方便地访问在世界范围的文档,万维网使用统一资源定位符URL 来指明因特网上任何种类“资源”的位置。
URL的一般形式由以下四个部分组成:
超文本传输协议(HTTP)
HTTP定义了浏览器(即万维网客户进程)怎样向万维网服务器请求万维网文档,以及万维网服务器怎样把万维网文档传送给浏览器。
HTTP/1.0
采用非持续连接方式。
在该方式下,每次浏览器要请求一个文件都要与服务器建立TCP连接,当收到响应后就立即关闭连接。
每请求一个文档就要有两倍的RTT的开销。
为了减小时延,浏览器通常会建立多个并行的TCP连接同时请求多个对象。但是,这会大量占用万维网服务器的资源。
HTTP/1.1
采用持续连接方式。
在该方式下,万维网服务器在发送响应后仍然保持这条连接,使同一个客户(浏览器)和该服务器可以继续在这条连接上传送后续的HTTP 请求报文和响应报文,只要这些文档都在同一个服务器上就行。
为了进一步提高效率,HTTP/1.1 的持续连接还可以使用流水线方式工作,即浏览器在收到HTTP 的响应报文之前就能够连续发送多个请求报文。
HTTP的报文格式
HTTP是面向文本的,其报文中的每一个字段都是一些ASCII码串,并且每个字段的长度都是不确定的。
使用Cookie在服务器上记录信息
HTTP早期被设计为一种无状态的协议。
现在,用户可以通过万维网进行各种复杂的应用,如网上购物、电子商务等。这些应用往往需要万维网服务器能够识别用户。
Cookie提供了一种机制使得万维网服务器能够“记住”用户,而无需用户主动提供用户标识信息。也就是说,Cookie 是一种对无状态HTTP进行状态化的技术。
万维网缓存与代理服务器
在万维网中还可以使用缓存机制以提高万维网的效率。
万维网缓存又称为Web缓存(Web Cache),可位于客户机,也可位于中间系统上,位于中间系统上的Web缓存又称为代理服务器(Proxy Server)。
Web缓存把最近的一些请求和响应暂存在本地磁盘中。当新请求到达时,若发现这个请求与暂时存放的请求相同,就返回暂存的响应,而不需要按URL的地址再次去因特网访问该资源。