计算机网络 | 应用层
应用层(Application layer)是七层OSI模型的第七层。应用层直接和应用程序接口并提供常见的网络应用服务。应用层也向表示层发出请求。应用层是开放系统的最高层,是直接为应用进程提供服务的。其作用是在实现多个系统应用进程相互通信的同时,完成一系列业务处理所需的服务。为操作系统或网络应用程序提供访问网络服务的接口。
目录
1. 概述
因为不同的网络应用之间需要有一个确定的通信规则
1.1 两种常用的网络应用模型
1.1.1 客户/服务器模型(Client/Server)
1.1.2 P2P模型(Peer-to-Peer)
网络健壮性指的是P2P模型不容易坏掉,即使一个节点坏了也没问题,可以有其他节点代替
2. 域名系统协议(DNS)
2.1 概述
DNS就是将打在地址栏的域名转化为IP地址的系统
- 主机将域名发送给DNS服务器
- DNS服务器将IP地址发送给主机
- 主机拿着IP地址访问服务器,通讯,发送数据
2.1.1 域名
域名就是www.xxx.com,当然这是最简单的一种
.com右边之后还可以有东西,称之为根
域名从左向右,级别逐渐增高
2.2 域名服务器(DNS服务器)
DNS服务器有很多台,根据层次结构分为三层,根域名服务器,顶级域名服务器,权限域名服务器
本地域名服务器不算层次结构,特点是里主机比较近,当主机和另一台比较近的主机通信时,就不用走哪些更高级的服务器了
根域名服务器并不是一个域名只有一台,而是一个域名对应多台域名服务器,全世界一共有13个这样的域名,分别是a.rootservers.net,b.rootservers.net,c.rootservers.net,m.rootservers.net
在权限域名服务器中,虽然看似abc.com比y.abc.com少了一位,但是他们的地位仍是对等的,对应的两台权限域名服务器
本地域名服务器,先查询本地,快速
本地域名服务器->根域名服务器->顶级域名服务器->权限域名服务器
2.3 域名解析过程
递归查询,靠根域名服务器问顶级域名服务器再问权限域名服务器,一层一层往下找
迭代查询,主机先问根域名服务器返回信息,主机再问对应的顶级域名服务器返回信息,主机再问权限域名服务器
2.3.1 递归查询
在上图中
主机先是想本地域名服务器发送请求,如果查不到的话,
本地域名服务器向根域名服务器发送请求(找别人),如果还是查不到的话,
根域名域名服务器向顶级域名服务器发送请求(找别人),如果还是查不到的话,
顶级域名服务器向权限域名服务器发送请求(找别人)
可以看到每一次向下一个查询的服务器都变了,不是主机一个个去问,而是靠DNS服务器自己一个个问下去
2.3.2 迭代查询
在上图中
主机先是想本地域名服务器发送请求,如果查不到的话,
本地域名服务器就让主机去向根域名服务器发送请求(主机去找,本地域名给目标根域名服务器的IP地址),如果还是查不到的话,
根域名域名服务器让主机去向对应的顶级域名服务器发送请求(主机去找,根域名给目标顶级域名服务器的IP地址),如果还是查不到的话,
顶级域名服务器让主机去向权限域名服务器发送请求(主机去找,顶级域名给目标权限域名服务器的IP地址)
可以看到这里是主机一个个挨个问的地址
2.3.3 高速缓存
为了减少多次查询同一个域名的资源浪费,本地域名服务器会存储最近使用的ip地址解析,下次再访问同一个域名就不需要这么多查询步骤了。同时这个高速缓存主机本身也有存储
同时本地域名服务器还可以对顶级域名服务器,权限域名服务器的地址进行缓存,下一次即使是不知道的ip地址,查询也可以更快
高速缓存为了保持正确性,需要定时更新
3. 文件传输协议(FTP,TFTP)
FTP,File Transfer Protocol,文件传送协议
TFTP,Trivial File Transfer Protocol,简单文件传送协议
3.1 概述
TFTP是一个轻量的,比较容易实现的,面对小文件的,UDP的文件传输协议
这里我们重点是FTP协议
3.2 FTP的服务端和客户端
3.3 FTP的工作原理
为什么有匿名登陆:对于一些公共服务器来说,增加验证阶段就是增加资源开销,减少验证阶段就可以节省资源来更好地服务
主进程和从属进程的区别:主进程是打开端口,让外部发送的数据可以进来,并且将这些数据逐个分配各从属进程。从属进程则是单独为这些数据服务
FTP使用TCP实现可靠传输
先注释一下这里的主进程被忽略掉了,只是没标在上面,不是没有啊
这里客户端和服务器端先建立TCP连接,端口是21,称为控制连接,控制连接始终保持
然后看情况是主动建立连接还是被动建立连接
主动建立连接是指服务器端主动发送请求和客户端进行连接, 此时端口号固定是20
被动连接是指客户端发送请求和服务器端建立数据传送连接,此时端口号是不确定,有两者协商得到,端口>1024
数据传输完成之后,数据连接断开,控制连接继续保持,直至两边发送断开请求
FTP的两种传输模式了解即可
4. 电子邮件
4.1 概述
4.1.1 电子邮件的格式
4.1.2 电子邮件系统的组成结构
用户代理(电子邮件客户端软件)的四个功能解释:
撰写就是给用户编辑信件的环境
显示就是可以看到自己写的和自己收的信件内容
处理就是对信件进行操作,包括删除,打印,转发等等
通信就是可以将邮件发送到邮件服务器当中,同时可以从邮件服务器当中读取邮件
邮件服务器(电子邮服务端)的功能注释
邮件服务器端的发送和接受是指从自己的用户代理处接收邮件,之后向对面的邮件服务器发送邮件
邮件服务器的报告邮件发送结果就是投递是否成功这种情况
邮件服务器既可以作为客户端又可以作为服务器端,使用的是C/S方式
协议的功能注释
发邮件用的是SMTP(Simple Mail Transfer Protocol,简单邮件传输协议)
收邮件的是POP3(Post Office Protocol - Version 3,邮局协议版本3)或者IMAP(Interactive Mail Access Protocol,交互邮件访问协议)
4.2 几个邮件协议
4.2.1 简单邮件传送协议SMTP
注意一下,这里STMP客户和服务器不是固定死的,可以也可以成为服务器,服务器也可以成为用户,由发送方和接收方决定,发送方就是客户,接收方就是服务器
应答信息:
- 220 service ready
- HELLO
- 250 OK
- 421 service not available
- 550 no such user here
- 354 start mail input;end with
- 221 连接释放
这里RCPT能有多条命令的原因是,电子邮件可以有多个收件人,就是群发,所以允许多个RCPT
再强调一下,这里服务器和客户端可以互换,视具体情况而定,发送方是客户端,接收方是服务器端
4.2.2 改进SMTP缺点的MIME协议
MIME改善SMTP发送数据的缺点,是SMTP的功能性扩展,使传输内容丰富多彩
MIME协议已经逐渐开始应用到浏览器当中,通过对不同文件类型用不同的标识符标识,来让浏览器读取通过MIME的相关文件
4.2.3 邮局协议POP3
这里接收方是客户端,邮件服务器是服务器端
POP3确实很简单,但是有不少缺点,比较难受的就是邮件一旦下载就自动删除了
4.2.4 比较复杂的读取邮件的协议——IMAP协议
4.3 基于万维网的电子邮件
与之前的不同的地方就是,基于万维网的电子邮件的邮件服务器端可以不同
同时,发送邮件使用的SMTP/MIME和收邮件时的POP3/IMAP协议都换成了HTTP协议
5. 万维网和HTTP协议
5.1 万维网概述
WWW(World Wide Web,万维网)
URL(Uniform Resource Locator,同一资源定位符),用来唯一标识整个互联网当中的某一个资源(文字,视屏,音频等)的位置,不区分大小写
用户点击HTTP(HyperText Transfer Protocol,超文本传输协议),将这些资源传送回用户
HTML(HyperText Markup Language,超文本标记语言)帮助设计者来设计页面,让不同设计者设计的页面都可以在界面上显示
5.2 HTTP协议
5.2.1 HTTP协议的过程
服务器通过TCP 80端口来监听HTTP请求
注意HTTP可以不一次性下载完页面的所有资源,可以只下载文本部分,其他音频视频等待用户下一步请求之后再传输
5.2.2 HTTP协议的特点
无状态:多次多地点访问,一开始都一样,没有记忆。但是可以通过cookie小饼干,存储用户访问记录,提供个性化服务
http采用tcp作为传输层协议,但是ht tp本身无连接(即在交换http报文之前不需要建立http连接)
5.2.3 HTTP的连接方式——持久连接和非持久连接
非持久连接在TCP三次握手的第三次握手时发生,将HTTP请求作为第三次握手的数据部分发给服务器,服务器收到请求之后将HTTP相应报文传输给客户。耗时就是RTT*2+文档传输时间。
缺点就是这样如果再想传输,那么就需要重新建立TCP连接从头开始
持久连接和非持久连接类似,都是在第三次握手时发生,将HTTP请求作为第三次握手的数据部分发给服务器,服务器收到请求之后将HTTP相应报文传输给客户。但是持久连接再需要请资源的时候就不需要建立新的TCP连接了
持久连接的两种方式——非流水线和流水线
非流水线就是发一个,确认一个,才能再发下一个
流水线就是一个个连着发,然后多个确认
和之前说过的停止等待协议,后退N帧协议GBN和选择重传协议SR很像 数据链路层
5.2.4 HTTP的报文结构
开始行用于区别请求报文和响应报文。可以明显的看到两者第一行的东西都不一样
请求报文的方法是指命令,就是对所请求的对象进行什么操作,如获取/删除等等;URL就是之间说的资源标识符;版本是指使用的是什么版本的HTTP协议
CRLF相当于我们程序里面的;
,标识一行的结束。同时,在整个首部行结束时,为了区别首部行和实体主体还会有一行单独的CRLF
这里举了请求报文的例子,和一些常用的状态码
HTTP状态码列表:
状态码 | 状态码英文名称 | 中文描述 |
---|---|---|
100 | Continue | 继续。客户端应继续其请求 |
101 | Switching Protocols | 切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到HTTP的新版本协议 |
200 | OK | 请求成功。一般用于GET与POST请求 |
201 | Created | 已创建。成功请求并创建了新的资源 |
202 | Accepted | 已接受。已经接受请求,但未处理完成 |
203 | Non-Authoritative Information | 非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本 |
204 | No Content | 无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,可确保浏览器继续显示当前文档 |
205 | Reset Content | 重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。可通过此返回码清除浏览器的表单域 |
206 | Partial Content | 部分内容。服务器成功处理了部分GET请求 |
300 | Multiple Choices | 多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择 |
301 | Moved Permanently | 永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替 |
302 | Found | 临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI |
303 | See Other | 查看其它地址。与301类似。使用GET和POST请求查看 |
304 | Not Modified | 未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源 |
305 | Use Proxy | 使用代理。所请求的资源必须通过代理访问 |
306 | Unused | 已经被废弃的HTTP状态码 |
307 | Temporary Redirect | 临时重定向。与302类似。使用GET请求重定向 |
400 | Bad Request | 客户端请求的语法错误,服务器无法理解 |
401 | Unauthorized | 请求要求用户的身份认证 |
402 | Payment Required | 保留,将来使用 |
403 | Forbidden | 服务器理解请求客户端的请求,但是拒绝执行此请求 |
404 | Not Found | 服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面 |
405 | Method Not Allowed | 客户端请求中的方法被禁止 |
406 | Not Acceptable | 服务器无法根据客户端请求的内容特性完成请求 |
407 | Proxy Authentication Required | 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权 |
408 | Request Time-out | 服务器等待客户端发送的请求时间过长,超时 |
409 | Conflict | 服务器完成客户端的 PUT 请求时可能返回此代码,服务器处理请求时发生了冲突 |
410 | Gone | 客户端请求的资源已经不存在。410不同于404,如果资源以前有现在被永久删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置 |
411 | Length Required | 服务器无法处理客户端发送的不带Content-Length的请求信息 |
412 | Precondition Failed | 客户端请求信息的先决条件错误 |
413 | Request Entity Too Large | 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息 |
414 | Request-URI Too Large | 请求的URI过长(URI通常为网址),服务器无法处理 |
415 | Unsupported Media Type | 服务器无法处理请求附带的媒体格式 |
416 | Requested range not satisfiable | 客户端请求的范围无效 |
417 | Expectation Failed | 服务器无法满足Expect的请求头信息 |
500 | Internal Server Error | 服务器内部错误,无法完成请求 |
501 | Not Implemented | 服务器不支持请求的功能,无法完成请求 |
502 | Bad Gateway | 作为网关或者代理工作的服务器尝试执行请求时,从远程服务器接收到了一个无效的响应 |
503 | Service Unavailable | 由于超载或系统维护,服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的Retry-After头信息中 |
504 | Gateway Time-out | 充当网关或代理的服务器,未及时从远端服务器获取请求 |
505 | HTTP Version not supported | 服务器不支持请求的HTTP协议的版本,无法完成处理 |
6. 本章思维导图
本章常用中英文对照
Server farm 服务器集群
Infrastructure 基础设施,或基础架构
Self-scalability 自扩展性
Timing 实时性
Connection-oriented service 面向连接的服务
Base HTML file 基本HTML文件
Stateless protocol 无状态协议
RTT (round-trip time ) 往返时间
User agents 用户代理
Mail servers 邮件服务器
Top-level domain (TLD) servers 顶级域名服务器
Authoritative DNS servers P161 权威域名服务器
Iterative queries 迭代查询
Resource records (RRs) 资源记录
Nonpersistent HTTP 非持久HTTP,或非坚持HTTP
Persistent HTTP 持久性HTTP,或坚持的HTTP
Peer-to-Peer (P2P) Network 对等网络
Socket programming 套接字编程