1.1 HTTP-因特网的多媒体信使
HTTP是web的基石,应用广泛。它使用可靠的数据传输协议既方便了开发者也使用户更放心。
1.2 Web客户端和服务器
Web服务器也常被称为HTTP服务器。HTTP客户端和HTTP服务器共同构成了万维网的基本组件。浏览器(web客户端)发送一条请求给web服务器,web服务器会去寻找所期望的对象,如果成功,就将对象、对象类型、对象长度以及其他一些信息放在HTTP响应中发送给客户端。
1.3 资源
Web服务器是web资源的宿主。Web资源是web内容的源头。最简单的web资源就是web服务器文件系统中的静态文件。如文本、HTML文件、word、Adobe、图片、AVI电影等。
除了以上静态资源还可以是*根据需要生成内容的软件程序。*这些动态内容资源可以根据你的身份、所请求的信息和每天的不同时段来产生内容。
所有类型的内容来源都是资源。
1.3.1 媒体类型
MIME(Multipurpose Internet Mail Extension,多用途因特网邮件扩展)可以用来描述并标记多媒体内容。是一种文本标记,表示一种主要的对象类型和一个特定的子类型,中间用一条斜杠来分隔。
web服务器会为所有HTTP对象数据附加一个MIME类型。web浏览器可以查看之,从而知道怎么处理该对象。
HTML格式文档由 text/html类型标记。
ASCII文档 : text/plain.
JPEG格式图片: image/jpeg。
PowerPoint:application/vnd.ms-powerpoint.
1.3.2 URI
每个web服务器资源都有一个名字,服务器资源名被称为统一资源标识符(Uniform Resource Identifier,URI)。它可以在世界范围内唯一标识并定位信息资源。
1.3.3 URL
统一资源定位符(URL)是资源标识符最常见的形式。描述了一台特定服务器上某资源的特定位置。URL格式包括3部分:
方案:说明访问资源所使用的协议类型。如http://
服务器的因特网地址:www.baidu.com。
服务器上的某个资源:/spacials/saw-blade.gif。
1.3.4 URN
统一资源名(URN)。它是作为特定内容的唯一名称来使用的,与目前的资源所在地无关。它仍处于试验阶段。
1.4 事务
一个HTTP事务由一条(从客户端发往服务器)请求命令和一个(从服务器发回客户端的)相应结果组成。这种通信是通过名为HTTP报文(http Message)的格式化数据块进行的。
1.4.1 方法
HTTP支持几种不同的请求命令,这些命令被称为HTTP方法(HTTP method)。
GET:从服务器向客户端发送命名资源。
PUT:将来自客户端的数据存储到一个命名的服务器资源中去。
DELETE:从服务器中删除命名资源。
POST:将客户端数据发送到一个服务器网关应用程序。
HEAD:仅发送命名资源响应中的HTTP首部。
1.4.2 状态码
每条HTTP响应报文返回时都会携带一个状态码。由3位数字组成。
1.4.3 web页面中可以包含多个对象
应用程序完成一项事务时通常会发布多个HTTP事务。如web浏览器会发布一系列HTTP事务来获取并显示一个包含了丰富图片的web页面。浏览器会执行一个事务来获取描述页面布局的HTML框架,然后发布另外的HTTP事务来获取每个嵌入式图片、图像面板、java小程序等。这些嵌入式资源甚至可以位于不同的服务器上。一个web页面通常并不是单个资源,而是一组资源的集合。
1.5 报文
HTTP报文由一行一行简单字符串组成,是纯文本不是二进制代码。包括请求报文和响应报文。它由三部分组成:
起始行:在请求报文中说明要做些什么,在响应报文中说明出现了什么状况。
首部:起始行后面有0个或多个首部字段,每个首部字段都包含了一个名字和一个值,为了便于解析,两者之间用:分割。首部由一个空行结束。
主体:空行之后就是可选的报文主体了,其中包含了所有类型的数据。请求主题中包括了要发送给服务器的数据,响应主体中包括了要返回给客户端的数据。起始行和首部都是文本形式且都是结构化的,而主体则不同,主体可以包含任意的二进制数据(比如图片、视频、音频、软件程序等)。
1.6 连接
报文是如何通过传输控制协议(Transmission Control Protocol,TCP)连接从一个地方搬移到另一个地方去的?
1.6.1 TCP/IP
TCP提供:
无差错的数据传输。
按序传输(数据总是会按照发送的顺序到达)。
未分段的数据流(可以在任意时刻以任意尺寸将数据发送出去)。
1.6.2 连接、IP地址及端口号
在HTTP客户端向服务器发送报文之前,需要用网际协议(Internet Protocol,IP)地址和端口号在客户端和服务器之间建立一条TCP/IP连接。
1.6.3 一个试用Telnet的实例
Telnet程序可以将键盘连接到某个目标TCP端口,并将此端口的输出回送到显示屏上。他几乎可以连接所有的TCP服务器。
1.7 协议版本
HTTP/0.9:老版本,只支持GET方法,他最初只是为了获取简单的HTML对象。
HTTP/1.0:添加了版本号、各种HTTP首部、一些额外的方法,以及对多媒体对象的处理。
HTTP/1.0+:包含很多特性,如持久的keep-alive连接、虚拟主机以及代理连接支持。
HTTP/1.1:重点关注校正HTTP设计中的结构性缺陷,明确语义,引入重要的性能优化措施,并删除一些不好的特性。
HTTP-NG(HTTP/2.0):重点关注性能的大幅优化,以及更强大的服务逻辑远程执行框架。研究工作终止于1998年,目前尚未能取代HTTP/1.1。
1.8 web的结构组件
一些比较重要的应用程序:
代理:位于客户端和服务器之间的HTTP中间实体
缓存:HTTP的仓库,使常用页面的副本可以保存在离客户端更近的地方。
网关:连接其他应用程序的特殊web服务器。
隧道:对HTTP通信报文进行盲转发的特殊代理。
agent代理:发起自动HTTP请求的半智能web客户端。
1.8.1 代理
HTTP代理服务器是web安全、应用集成以及性能优化的重要组成模块。
出于安全考虑,通常会将代理作为转发所有web流量的可信任中间节点使用。代理还可以对请求和响应进行过滤。如病毒检测过滤黄色信息。
1.8.2 缓存
web缓存或代理缓存是一种特殊的HTTP代理服务器,可以将代理传送的常用文档复制保存起来。
1.8.3 网关
是一种特殊的服务器,作为其他服务器的中间实体使用。通常用用于将HTTP流量转换成其他的协议。
1.8.4 隧道
是建立起来后就会在两条连接之间对原始数据进行盲转发的HTTP应用程序。HTTP隧道通常用来在一条或多条HTTP连接上转发非HTTP数据,转发时不会窥探数据。
1.8.5 Agent代理
是代表用户发起HTTP请求的客户端程序。所有发布web请求的应用程序都是Agent代理,如web浏览器。搜索引擎“网络蜘蛛”,可以从世界范围内获取web页面。
总结
HHTP协议简介,概要说明了HTTP是怎样使用URI来命名远程服务器上的多媒体资源的。如何利用HTTP请求和响应报文操纵远程服务器上的多媒体资源。几种使用HTTP的web应用程序。