第2章 应用层
文章目录
2.1 应用层协议原理
网络应用的体系结构
可能的应用架构:
客户-服务器模式(C/S:client/server)
对等模式(P2P:Peer To Peer)
混合体:客户-服务器和对等体系结构
客户-服务器(C/S)体系结构
服务器:
- 一直运行
- 固定的IP地址和周知的端口号(约定)
- 扩展性:服务器场数据中心进行扩展扩展性差
客户端:
- 主动与服务器通信
- 与互联网有间歇性的连接)
- 可能是动态IP地址
- 不直接与其它客户端通信
缺点 :可拓展性差 达到一定能限(阈值),性能暴跌 可靠性差
对等体(P2P)体系结构
- (几乎)没有一直运行的服务器
- 任意端系统之间可以进行通信
- 每一个节点既是客户端又是服务器
- 自扩展性-新peer节点带来新的
服务能力,当然也带来新的服务请求
- 自扩展性-新peer节点带来新的
- 参与的主机间歇性连接且可以改变地址
- 难以管理(缺点)
- 例子:Gnutella,迅雷
C/S和P2P体系结构的混合体
Napster
- **文件搜索:集中 **
- 主机在中心服务器上注册其资源
- 主机向中心服务器查询资源位置
- 文件传输:P2P
- 任意Peer节点之间
即时通信
- 在线检测:集中
- 当用户上线时,向中心服务器注册其IP地址
- 用户与中心服务器联系,以找到其在线好友的位置
- 两个用户之间聊天:P2P
进程通信
进程:在主机上运行的应用程序
- 在同一个主机内,使用
进程间通信机制通信(操作系统定义) - 不同主机,通过**交换报文(Message)**来通信
- 使用OS提供的通信服
务 - 按照应用协议交换报文
- 借助传输层提供的服务
- 使用OS提供的通信服
客户端进程:发起通信 的进程 服务器进程:等待连接 的进程
注意:P2P架构的应用也 有客户端进程和服务器进程之分
分布式进程通信需要解决的问题(应用进程如何使用传输层提供的服务交换报文)
问题1:进程标示和寻址问题 (对于进程 谁发/谁收,对等层实体之间)
问题2:传输层-应用层提供服务是如何 (上下层间)
- 位置:层间界面的SAP (TCP/IP :socket)
- 形式:应用程序接口API (TCP/IP :socket API)
问题3:如何使用传输层提供的服务,实现应用进程之间的报文交换,实现应用 (本层间)
定义应用层协议:报文格式,解释,时序等
编制程序,使用OS提供的API ,调用网络基础设施提 供通信服务传报文,实现应用时序等;
问题1:对进程进行编址(addressing)
- 进程为了接收报文,必须有一个标识
即: SAP(发送也需要标示)- 主机:唯一的32位IP地址
仅仅有IP地址不能够唯一标示一个进程;在一台端系统上有很多应用进程在运行 - 所采用的传输层协议:TCP or UDP
- **端口号(Port Numbers) 用来区分不同的应用进程 **
- 主机:唯一的32位IP地址
- 一些知名端口号的例子:
- HTTP: TCP 80 Mail: TCP 25 ftp: TCP 2
- 一个进程:用IP+port标示端节点
- 本质上,一对主机进程之间的通信由2个端节点构成
问题2:传输层提供的服务-需要穿过层间的信息
层间接口必须要携带的信息
- 要传输的报文(对于本层来说:SDU) (SDU——未经本层封装的) (发的什么)
- 谁传的:对方的应用进程的标示:IP+TCP(UDP)端口 (谁发的)
- 传给谁:对方的应用进程的标示:对方的IP+TCP(UDP)端口号 (发给谁)
传输层实体(tcp或者udp实体)根据这些信息进行TCP报文段(UDP数据报)的封装
- 源端口号,目标端口号,数据等
- 将IP地址往下交IP实体,用于封装IP数据报:源IP,目标IP
- 如果Socket API(原语)每次传输报文(穿过层间),都携带如此多的信息,太繁琐易错,不便于管理
- 用个代号标示通信的双方或者单方: socket
- 就像OS打开文件返回的句柄一样
对句柄的操作,就是对文件的操作
TCP socket
TCP socket:
- TCP服务,两个进程之间的通信需要之前要建立连扫
两个进程通信会持续一段时间,通信关系稳定 - 可以用一个整数表示两个应用实体之间的通信关系
,本地标示 - 穿过层间接口的信息量最小
- TCP socket: 源IP,源端口,目标IP,目标IP,目标
TCP socket 是一个整数(类似文件描述符)代表一个四元组(我的IP和端口号 对方的IP和端口号)
便于管理 使得穿过层间的信息量最小
是应用层和传输层的一个约定 本地会话的标识
对于使用面向连接服务(TCP)的应用而言,套接字是4元组的一个具有本地意义的标识
- 4元组: (源IP,源port,目标IP,目标port)
- 唯一的指定了一个会话(2个进程之间的会话关系)
- 应用使用这个标示,与远程的应用进程通信
- 不必在每一个报文的发送都要指定这4元组
- 就像使用操作系统打开一个文件,OS返回一个文件句柄一样,以后使用这个文件句柄,而不是使用这个文件的目录名、文件名
- 简单,便于管理
穿过层间接口的包括 ICI 和 SDU
UDP socket
UDP socket:
- UDP服务,两个进程之间的通信需要之前无需建立连接
每个报文都是独立传输的
前后报文可能给不同的分布式进程 - 因此,只能用一个整数表示本应用实体的标示
因为这个报文可能传给另外一个分布式进程·1○穿过层间接口的信息大小最小 - UDP socket:本IP,本端口
- 但是传输报文时:必须要提供对方IP,port
- 接收报文时:传输层需要上传对方的IP,port
对于使用无连接服务(UDP)的应用而言,套接字是2元组的一个具有本地意义的标识
- 2元组: IP,port(源端指定)
- UDP套接字指定了应用所在的一个端节点(endpoint>
- 在发送数据报时,采用创建好的本地套接字(标示ID),就不必在发送每个报文中指明自己所采用的ip和port
- 但是在发送报文时,必须要指定对方的ip和udpport(另外一个段节点)
套接字(Socket)
进程向套接字发送报文或从套接字接收报文
套接字<->门户
- 发送进程将报文推出门户,发送进程依赖于传输层设施在另外一侧的
门将报文交付给接受进程 - 接收进程从另外一端的门户收到报文(依赖于传输层设施)
问题3:如何使用传输层提供的服务实现应用
- 定义应用层协议:报文格式,解释,时序等
- 编制程序,通过API调用网络基础设施提供通信服务传报文,解析报文,实现应用时序等
应用层协议
定义了:运行在不同端系统上的应用进程如何相互交换报文
- 交换的报文类型:请求和应答报文
- 各种报文类型的语法:报文中的客个字段及其描述
- 字段的语义:即字段取值的含义进程何时、如何发送报文及对报文进行响应的规则
应用协议仅仅是应用的一个组成部分
Web应用:HTTP协议,web客户端,web服务器,HTML(超文本标记语言)
公开协议: 由RFC文档定义 允许互操作 如HTTP, SMTP
专用(私有)协议: 协议不公开 如:Skype
应用需要传输层提供什么样的服务?
如何描述传输层的服务?
数据丢失率
有些应用则要求100%的可
靠数据传输(如文件)
有些应用(如音频)能容忍
一定比例以下的数据丢失延迟
一些应用出于有效性考虑,对
数据传输有严格的时间限制
Internet电话、交互式游戏o延迟、延迟差吞吐
一些应用(如多媒体)必须
需要最小限度的吞吐,从而使得应用能够有效运转一些应用能充分利用可供使
用的吞吐(弹性应用)安全性
机密性完整性
可认证性(鉴别)
常见应用对传输服务的要求
Internet 传输层提供的服务
实体:实行网络协议的软件模块或硬件模块(运行中的)
TCP服务:
可靠的传输服务
流量控制:发送方不会淹
没接受方
拥塞控制:当网络出现拥
塞时,能抑制发送方
不能提供的服务:时间保
证、最小吞吐保证和安全面向连接:要求在客户端
进程和服务器进程之间建立连接
UDP服务:
不可靠数据传输
不提供的服务:可靠,
流量控制、拥塞控制、时间、带宽保证、建立连接
Q:为什么要有UDP?
UDP存在的必要性
- 能够区分不同的进程,而IP服务不能
- 在IP提供的主机到主机端到端功能的基础上,区分了主机的
应用进程
- 在IP提供的主机到主机端到端功能的基础上,区分了主机的
- 无需建立连接,省去了建立连接时间,适合事务性的应用
- 不做可靠性的工作,例如检错重发,适合那些对实时性要求比较高而对正确性要求不高的应用
- 因为为了实现可靠性(准确性、保序等),必须付出时间代
价(检错重发〉
- 因为为了实现可靠性(准确性、保序等),必须付出时间代
- 没有拥塞控制和流量控制,应用能够按照设定的速度发送数据
- 而在TCP上面的应用,应用发送数据的速度和主机向网络发送
的实际速度是不一致的,因为有流量控制和拥塞控制
- 而在TCP上面的应用,应用发送数据的速度和主机向网络发送
Internet应用及其应用层协议和传输协议
安全TCP
TCP & UDP
都没有加密 明文通过互联网传输 ,甚至密码
SSL 提供安全性
在TCP上面实现,提供加密的TCP连接 私密性 数据完整性 端到端的鉴别
SSL在应用层 应用采用SSL库,SSL 库使用TCP通信
SSL socket API 应用通过API将明文交 给socket,SSL将其加 密在互联网上传输 详见第8章
Https 跑在 SSL + TCP 上
2.2 Web and HTTP
一些术语
-
Web页:由一些对象组成
-
对象可以是HTML文件、JPEG图像、Java小程序、声音剪辑文件等
-
Web页含有一个基本的HTML文件,该基本HTML文件又包含若干对象的引用(链接)
-
通过URL对每个对象进行引用
访问协议,用户名,口令字,端口等; -
URL格式:
HTTP概况
HTTP: 超文本传输协议
Web的应用层协议
客户/服务器模式
客户: 请求、接收和显示 Web对象的浏览器
服务器: 对请求进行响应, 发送对象的Web服务器
HTTP 1.0: RFC 1945
HTTP 1.1: RFC 206
使用TCP:
- 客户发起一个与服务器的
TCP连接(建立套接字),端口号为80 - 服务器接受客户的TCP连接
- 在浏览器(HTTP客户端)
与Web服务器(HTTP服务器server)
交换HTTP报文(应用层协议报文) - TCP连接关闭
HTTP是无状态的 服务器并不维护关于客户的任何信息
维护状态的协议很复杂!
必须维护历史信息(状态)
如果服务器/客户端死机,它们的状态信息可能不一致, 二者的信息必须是一致
无状态的服务器能够支持更 多的客户端
HTTP连接
非持久HTTP 最多只有一个对象在 TCP连接上发送 下载多个对象需要多 个TCP连接 HTTP/1.0使用非持 久连接
持久HTTP 多个对象可以在一个 (在客户端和服务器 之间的)TCP连接上 传输 HTTP/1.1 默认使用 持久连接
非持久HTTP
响应时间模型
往返时间RTT(round-trip time):一个小的分组从客 户端到服务器,在回到客户 端的时间(传输时间忽略)
响应时间: 一个RTT用来发起TCP连接 一个 RTT用来HTTP请求并 等待HTTP响应 文件传输时间
总共:2个RTT + 一个对象的传输时间
持久HTTP
非持久HTTP的缺点:
每个对象要2个 RTT
操作系统必须为每个TCP连接分 配资源
但浏览器通常打开并行TCP连接 ,以获取引用对象
持久HTT