1、网络应用模型
1.1、应用层概述
应用层对 应用程序的通信 提供服务
- 应用层协议定义
- 应用进程交换的报文类型,请求还是响应?
- 各种报文类型的语法,如报文中的各个字段及其详细描述
- 字段的语义,即包含在字段中的信息的含义
- 进程何时、如何发送报文,以及对报文进行响应的规则
- 应用层的功能
- 文件传输、访问和管理
- 电子邮件
- 虚拟终端
- 查询服务和远程作业登录
- 应用层的重要协议
- FTP
- SMTP、POP3
- HTTP
- DNS
1.2、网络应用模型
-
客户/服务器模型(Client/Server)
-
P2P模型(Peer-to-peer):peer 对等,同辈
1)客户/服务器模型
服务器:提供计算服务的设备
- 永久提供服务
- 永久性访问地址/域名
客户机:请求计算服务的主机。
- 与服务器通信,使用服务器提供的服务
- 间歇性接入网络
- 可能使用动态IP地址
- 不与其他客户机直接通信
应用: Web,文件传输FTP, 远程登录,电子邮件
2)P2P模型
P2P模型特点:
- 不存在永远在线的服务器
- 每个主机既可以提供服务,也可以请求服务
- 任意端系统/节点之间可以直接通讯
- 节点间歇性接入网络
- 节点可能改变IP地址
- 可扩展性好
- 网络健壮性强 :一个节点坏了对网络无影响
2、DNS系统
域名系统(Domain Name System, DNS)
是因特网使用的命名系统,用来把便于人们记忆的具有特定含义的主机名转换为便于机器处理的IP地址。相对于IP地址,人们更喜欢使用具有特定含义的字符串来标识因特网上的计算机。值得注意的是,DNS系统采用客户/服务器模型,其协议运行在 UDP 之上,使用 53 号端口。
-
域名组成:字符、数字和符号
-
从概念上可将DNS分为3部分:层次域名空间、域名服务器和解析器
-
DNS系统实现域名到ip地址的转换
- 客户端输入域名,会传给DNS服务器,DNS服务器返回给客户端的IP地址。然后客户端就可以和服务端进行通信了,通信过程就是之前网络层、传输层、链路层、物理层所解决的问题
- 所以如果访问不了网站,有可能是网站崩溃了,也可能是DNS服务器出现问题
- ip地址与域名的对应关系是 一对多
2.1、层次域名空间
1)命名方法
因特网采用 层次树状结构 的命名方法。采用这种命名方法,任何一个连接到因特网的主机或路由器,都有一个唯一的层次结构名称,即 域名(Domain Name)。 域(Domain) 是名字空间中一个可被管理的划分。域还可以划分为子域,而子域还可以继续划分为子域的子域,这样就形成了顶级域、二级域、三级域等。每个域名都由标号序列组成,而各标号之间用点(“.”) 隔开
关于域名中的标号有以下几点需要注意
-
标号中的英文不区分大小写
-
标号中除连字符(-) 外不能使用其他的标点符号
-
每个标号不超过63个字符,多标号组成的完整域名最长不超过255个字符
-
级别最低的域名写在最左边,级别最高的顶级域名写在最右边
2)域名空间的树状结构
在域名系统中,每个域分别由不同的组织进行管理。每个组织都可以将它的域再分成一定数目的子域,并将子域委托给其他组织去管理。例如:管理CN域的中国将EDU.CN子域授权给中国教育和科研计算机网(CERNET)来管理
2.2、域名服务器
DNS的层次结构:
-
根域名服务器:根域名服务器是最高层次的域名服务器,所有的根域名服务器都知道所有的顶级域名服务器的IP地址。根域名服务器也是最重要的域名服务器,不管是哪个本地域名服务器,若要对因特网上任何一个域名进行解析,只要自己无法解析,就首先要求助于根域名服务器。因特网上有13个根域名服务器,尽管我们将这13个根域名服务器中的每个都视为单个服务器,但每个“服务器”实际上是冗余服务器的集群,以提供安全性和可靠性。需要注意的是,根域名服务器用来管辖顶级域(如.com),通常它并不直接把待查询的域名直接转换成IP地址,而是告诉本地域名服务器下一步应当找哪个顶级域名服务器进行查询。
-
顶级域名服务器:这些域名服务器负责管理在该顶级域名服务器注册的所有二级域名。收到DNS查询请求时,就给出相应的回答(可能是最后的结果,也可能是下一步应当查找的域名服务器的IP地址)。
-
权限域名服务器:每台主机都必须在授权域名服务器处登记。为了更加可靠地工作,一台主机最好至少有两个授权域名服务器。实际上,许多域名服务器都同时充当本地域名服务器和授权域名服务器。授权域名服务器总能将其管辖的主机名转换为该主机的IP地址。
-
本地域名服务器:本地域名服务器对域名系统非常重要。每个因特网服务提供者(ISP), 或一所大学,甚至一所大学中的各个系,都可以拥有一个本地域名服务器。当一台主机发出DNS查询请求时,这个查询请求报文就发送给该主机的本地域名服务器。事实上,我们在Windows系统中配置“本地连接”时,就需要填写DNS地址,这个地址就是本地DNS (域名服务器)的地址
2.3、域名解析过程
解析为IP地址
域名解析有两种方式:递归查询和递归与迭代相结合的查询
递归查询:靠别人
迭代查询:靠自已
-
主机 向 本地域名服务器 的查询采用的是 递归查询
也就是说,如果本地主机所询问的本地域名服务器不知道被查询域名的IP地址,那么本地域名服务器就以DNS客户的身份(主机靠本地域名服务器),向根域名服务器继续发出查询请求报文(即替该主机继续查询),而不是让该主机自己进行下一步的查询。在这种情况下,本地域名服务器只需向根域名服务器查询一次,后面的几次查询都是递归地在其他几个域名服务器之间进行的[见下图a中的步骤③~⑥]。在步骤⑦中,本地域名服务器从根域名服务器得到了所需的IP地址,最后在步骤⑧中,本地域名服务器把查询结果告诉主机m.xyz.com。
-
本地域名服务器 向 根域名服务器 的查询采用 迭代查询
当根域名服务器收到本地域名服务器发出的迭代查询请求报文时,要么给出所要查询的IP地址,要么告诉本地域名服务器:“你下一步应当向哪个顶级域名服务器进行查询”。然后让本地域名服务器自己(本地域名服务器靠自己)向这个顶级域名服务器进行后续的查询,如图(b)所示。 同样,顶级域名服务器收到查询报文后,要么给出所要查询的IP地址,要么告诉本地域名服务器下一步应向哪个权限域名服务器查询。最后,知道所要解析的域名的IP地址后,把这个结果返回给发起查询的主机
高速缓存:为了提高DNS的查询效率,并减少因特网上的DNS查询报文数量,在域名服务器中广泛地使用了高速缓存。当一个DNS服务器接收到DNS查询结果时,它能将该DNS信息缓存在高速缓存中。这样,当另一个相同的域名查询到达该DNS服务器时,该服务器就能够直接提供所要求的IP地址,而不需要再去向其他DNS服务器询问。因为主机名和IP地址之间的映射不是永久的,所以DNS服务器将在一段时间后丢弃高速缓存中的信息
3、文件传输协议FTP
3.1、FTP的工作原理
1)文件传送协议
-
文件传送协议FTP ( File Transfer Protocol)功能:
- 提供 不同种类主机系统 (硬、软件体系等都可以不同)之间的文件传输能力
- 以 用户权限管理 的方式提供用户对远程FTP服务器上的文件管理能力
- 以 匿名 FTP的方式提供公用文件共享的能力。
- FTP使用 TCP 实现可靠传输
-
简单文件传送协议TFTP (Trivial File Transfer Protocol)
trivial [ˈtrɪviəl] 不重要的;琐碎的;微不足道的
- 只需要知道这是一个很小,而且易于实现的一种文件传送协议即可
- 优点:非常适合 UDP 环境
2)FTP服务器和用户端
- FTP是基于客户/服务器(C/S)的协议
- 用户通过一个客户机程序连接至在远程计算机上运行的服务器程序
- 依照FTP协议提供服务,进行文件传送的计算机就是FTP服务器
- 连接FTP服务器,遵循FTP协议与服务器传送文件的电脑就是FTP客户端
3)FTP工作原理
-
登陆:ftp地址、用户名&密码
-
匿名登陆
- 互连网中有很大一部分FTP服务器被称为“匿名”(Anonymous) FTP 服务器。这类服务器的目的是向公众提供文件拷贝服务,不要求用户事先在该服务器进行登记注册,也不用取得FTP服务器的授权。
- Anonymous (匿名文件传输)能够使用户与远程主机建立连接并以匿名身份从远程主机上拷贝文件,而不必是该远程主机的注册用户。用户使用特殊的用户名“anonymous”登陆FTP服务,就可访问远程主机上公开的文件
-
FTP使用 TCP 实现可靠传输
-
服务器进程
- 1个主进程:负责接收新的请求(理发店的迎宾迎接新的顾客)
- n个从属进程:负责处理单个请求(Tony老师给每个顾客理发)
- 一个FTP服务器进程可同时为多个客户进程提供服务
-
服务器进程工作步骤
- ①打开熟知端口 21 (控制端口),使客户进程能够连接上
- ②等待客户进程发连接请求
- ③启动从属进程来处理客户进程发来的请求。主进程与从属进程并发执行,从属进程对客户进程的请求处理完毕后即终止
- ④回到等待状态,继续接收其他客户进程的请求
-
FTP服务器必须在整个会话期间保留用户的状态信息。特别是服务器必须把指定的用户账户与控制连接联系起来,服务器必须追踪用户在远程目录树上的当前位置
3.2、控制连接和数据连接
两个圆柱表示系统正在运行的进程
-
FTP在工作时使用 两个并行的TCP连接
- 一个是控制连接(端口号 21 )
- 一个是数据连接(端口号 20 )
- 使用两个不同的端口号可使协议更加简单和更容易实现
- 这两个连接就是 从属进程
-
控制连接
- 建立控制连接:服务器监听21号端口,等待客户连接,建立在这个端口上的连接称为控制连接
- 控制连接传送控制信息(请求):控制连接用来传送控制信息(如连接请求、传送请求等)。FTP客户发出的传送请求,通过控制连接发送给服务器端的控制进程
- 传输模式:控制信息都以 7位ASCII格式 传送
- 始终打开:在传输文件时还可以使用控制连接,因此控制连接整个会话期间一直保持打开状态
-
数据连接
-
数据连接端口号为 20:是否使用TCP20端口建立数据连接与传输模式有关
主动方式 使用TCP20端口
被动方式 由服务器和客户端自行协商决定(端口>1024)
-
创建数据连接和数据传送进程:服务器端的控制进程在接收到FTP客户发来的文件传输请求后,就创建“数据传送进程”和“数据连接”
-
数据传送进程传送文件:数据连接用来连接客户端和服务器端的数据传送进程,数据传送进程实际完成文件的传送
-
传送完毕后关闭:在传送完毕后关闭“数据连接”并结束运行
-
-
FTP传输模式
- 文本模式: ASCII模式, 以文本序列传输数据
- 二进制模式: Binary模式, 以二进制序列传输数据
因为FTP使用了一个分离的控制连接,所以也称FTP的控制信息是 带外(Out-of-band) 传送 的。使用FTP时,若要修改服务器上的文件,则需要先将此文件传送到本地主机,然后再将修改后的文件副本传送到原服务器。网络文件系统(NFS)允许 进程打开 一个远程文件,并在该文件的某个特定位置开始读写数据。这样,NFS可使用户复制一个大文件中的一个很小的片段,而不需要复制整个大文件
4、电子邮件
4.1、电子邮件系统概述
1)电子邮件的信息格式
2)组成结构
客户A要给客户B发邮件,在客户端软件写好邮件后发送,先到发送方邮件服务器上,然后发送到接收方邮件服务器上,最后发送给客户B的客户端上
4.2、SMTP协议
1)简单邮件传输协议SMTP
SMTP(Simple Mail Transfer Protocol)规定了在两个相互通信的SMTP进程之间应如何交换信息
- 两个STMP进程:负责发送邮件的SMTP进程就是 SMTP客户,负责接收邮件的进程就是 SMTP服务器
- SMTP规定了14条命令(几个字母)和21种应答信息(三位数字代码+简单文字说明)
- SMTP特点:TCP连接、端口号 25、C/S 网络应用模型
- SMTP通信三个阶段:连接建立——邮件传送——连接释放
2)通用因特网邮件扩充MIME
-
SMTP的缺点
-
SMTP 不能传送 可执行文件 或者其他二进制对象
-
SMTP仅限于传送 7位ASCI码,不能传送其他非英语国家的文字
-
SMTP服务器会 拒绝超过一定长度的邮件
-
MIME可以理解为在SMTP协议上的一种扩充手段
- MIME原理图
- MIME功能:使电子邮件系统可以支持声音、图像、视频、多种国家语言等等。使得传输内容丰富多彩 。MIME最早应用于邮件扩充,但是现在逐步应用于浏览器
4.3、POP3协议
1)邮局协议POP3
Post office protocol:POP
第3版
- POP3特点:TCP 连接、端口号 110、C/S 网络应用模型
- POP3工作方式:(接收方把邮件从接收端邮件服务器读取出来后,对邮件的处理有两种方式)
- 下载并保留(在服务器)
- 下载并删除
可以看出邮局协议POP3是非常简单、功能有限的一种邮件读取协议,对于邮件要么下载保留要么下载删除,不能根据用户需要决定是否上传到用户计算机上。因此有一种新的网际报文存取协议IMAP
2)网际报文存取协议IMAP
IMAP协议比POP协议复杂。当用户PC上的IMAP客户程序打开IMAP服务器的邮箱时,用户可以看到邮箱的首部,若用户需要打开某个邮件,该邮件才上传到用户的计算机上。
IMAP可以让用户在不同的地方使用不同的计算机随时上网阅读处理邮件,还允许只读取邮件中的某一个部分(先看正文,有WiFi的时候再下载附件)
4.4、基于万维网的电子邮件
使用 HTTP 协议
现在日常生活中普遍使用的一种发邮件方式。通过使用浏览器,登陆电子邮箱,就可以发送邮件了。不需要下载邮件客户端
特点:用户代理发送邮件和读取邮件都使用 HTTP 协议。邮件服务器直接的发送环节还是使用SMTP协议(简单邮件传输协议)
4.5、总结
5、万维网WWW和HTTP协议
5.1、WWW的概念与组成结构
-
万维网www是什么:万维网www (World Wide Web)是一个大规模的、联机式的信息储藏所/资料空间,是无数个网络站点和网页的集合
-
如何访问/获取这些资源:统一资源定位符 URL 唯一标识——>资源(文件、视频、音频...)
-
URL一般形式
- 端口和路径可以省略
- URL不区分大小写
-
如何操作才能定位到资源:用户通过点击超链接( 百度一下,你就知道)获取资源,这些资源通过超文本传输协议(HTTP)传送给使用者。
- 万维网以客户/服务器(C/S)方式工作:用户使用的浏览器就是万维网客户程序,万维网文档所驻留的主机运行服务器程序。
-
万维网www是什么:万维网使用超文本标记语 HTML )使得万维网页面设计者可以很方便地从一个界面的链接转到另一个界面,并能够在自己的屏幕上显示出来
5.2、超文本传输协议HTTP
- HTTP协议功能:HTTP(Hyper Text Transfer Protocol)协议定义了浏览器(万维网客户进程)怎样向万维网服务器请求万维网文档,以及服务器怎样把文档传送给浏览器
1)HTTP操作过程
从协议执行过程来说,浏览器要访问WWW服务器时,首先要完成对WWW服务器的域名解析。一旦获得了服务器的IP地址,浏览器就通过TCP向服务器发送连接建立请求
- 万维网工作过程
- 每个万维网站点都有一个服务器进程,它不断地监听TCP的端口80(默认),当监听到连接请求后便与浏览器建立连接
- TCP连接建立后,浏览器就向服务器发送请求获取某个Web页面的HTTP请求
- 服务器收到HTTP请求后,将构建所请求Web页的必需信息,并通过HTTP响应返回给浏览器
- 浏览器再将信息进行解释,然后将Web页显示给用户
- 最后,TCP连接释放
- 用户浏览页面方法
- 输入URL
- 点击超链接
- 客户点击超链接,接下来发生的事件顺序如下:
- 浏览器分析URL
- 浏览器向DNS请求解析IP地址
- DNS解析出IP地址
- 浏览器与服务器建立TCP连接
- 浏览器发出取文件命令
- 服务器响应
- 释放TCP连接
- 浏览器显示,浏览器可以先只下载文本部分
2)HTTP协议的特点
-
非持久连接:对于非持久连接,每个网页元素对象(如JPEG图形、Flash等)的传输都需要 单独建立一个TCP连接,如图所示(第三次握手的报文段中捎带了客户对万维网文档的请求)。也就是说,请求一个万维网文档所需的时间是 该文档的传输时间 (与文档大小成正比)加上 两倍往返时间RTT
(一个RTT用于TCP连接,另一个RTT用于请求和接收文档) -
持久连接:所谓持久连接,是指万维网服务器在发送响应后 仍然保持这条连接,使同一个客户和服务器可以继续在这条连接上传送后续的HTTP请求与响应报文
- 非流水线方式:客户在收到前一个响应后才能发出下一个请求
- 流水线方式:HTTP/1.1 的 默认方式 是使用流水线的持久连接。这种情况下,客户每遇到一个对象引用就立即发出一个请求,因而客户可以逐个地连续发出对各个引用对象的请求。如果所有的请求和响应都是连续发送的,那么所有引用的对象共计经历1个RTT延迟,而不是像非流水线方式那样,每个引用都必须有1个RTT延迟
3)报文结构
- HTTP报文
- 请求报文
- 响应报文
- 报文格式:HTTP报文是 面向文本 的,因此在报文中的每一个字段都是一些 ASCII码串
6、总结