JavaWeb核心技术学习笔记(二)——Http协议

02 Http协议

上一章节我们粗略学习了一下HttpClient的用法,体验了应用层编程的一个小程序。其中我们使用的HttpClient的包,它其实内部使用的就是Http协议来进行内容交互。接下来我们还是通过知识点,来详细学习Http协议的内容。

Http简介

  • HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web)服务器传输超文本到本地浏览器的传送协议。
  • HTTP基于TCP/IP通信协议来传递数据(HTML文件、图片文件、查询结果等)。
  • HTTP是一个属于应用层的面向对象的协议,由于其简洁、快速的方式,适用于分布式超媒体信息系统。
  • HTTP协议工作于客户端-服务器架构。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。服务器根据接收到的请求后,向客户端发送响应信息。

Http工作原理

  1. 客户端连接到web服务器
    • 一个HTTP客户端,通常是浏览器,与web服务器的HTTP端口(默认为80)建立一个TCP套接字连接。例如:http://www.chinacourt.org
  2. 发送HTTP请求
    • 通过TCP套接字,客户端向web服务器发送一个文本的请求报文,一个请求报文由请求行、请求头部、空行和请求数据4部分组成。
  3. 服务器接受请求并返回HTTP响应
    • web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。一个响应由状态行、响应头部、空行和响应数据4部分组成。
  4. 释放TCP连接
    • 若connection模式为close,则服务器主动关闭TCP连接,客户端被动关闭连接,释放TCP连接;若connection模式为keepalive,则该连接会保持一段时间,在该时间内可以继续接收请求。
  5. 客户端浏览器解析HTML内容

URL与URI

  • web上可用的每种资源如HTML文档、图像、视频片段、程序等都是一个URI(Uniform Resource Identifiers)来定位的,URI一般由三部分组成:
    1. 访问资源的命名机制
    2. 存放资源的主机名
    3. 资源自身的名称,由路径表示,着重强调于资源。
  • URL(Uniform Resource Locator)是Internet上用来描述信息资源的字符串,主要用在各种WWW客户程序和服务器程序上,采用URL可以用一种统一的格式来描述各种信息资源,包括文件、服务器的地址和目录等。URL一般由三部分组成:
    1. 协议(或称为服务方式)
    2. 存有该资源的主机IP地址(有时也包括端口号)
    3. 主机资源的具体地址,如目录和文件名等。
  • URL是URI的子集

请求消息格式

客户端发送一个HTTP请求到服务器的请求消息包括以下格式:

  • 请求行(request line)
  • 请求头部(header,可能有多行)
  • 空行
  • 请求数据

我们来举一个具体的请求消息的例子,观察下面一段报文(为了方便观察,在行头添加了行数):

  1. POST / HTTP1.1
  2. Host:www.worx.com
  3. User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.648; .NET CLR 3.5.21022)
  4. Content-Type:application/x-www-form-urlencoded
  5. Content-Length:40
  6. Connection: Keep-Alive
  7. (空行)
  8. name=Professional%20Ajax&publisher=Wiley
  9. ……

可以看到:

  • 第1行:请求行。POST说明请求方法为POST,后一部分说明使用的是HTTP1.1版本。
  • 第2-6行:请求头部。HOST将指出请求的目的地。服务器端和客户端脚本都能访问User-Agent,它是浏览器类型检测逻辑的重要基础。该信息由你的浏览器来定义,并且在每个请求中自动发送等等。
  • 第7行:空行。即使以下请求数据部分都为空,也必须有一个空行。
  • 第8行及以下:请求数据。请求数据为携带给服务器的参数信息。

请求方法

根据HTTP标准,HTTP请求可以使用多种请求方法。

  • HTTP1.0定义了三种请求方法:GET,POST和HEAD方法。
    • GET:请求指定的页面信息,并返回实体主体。
    • HEAD:类似于GET请求,只不过返回的响应中没有具体的内容,用于获取报头。
    • POST:向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立或已有资源的修改。
  • HTTP1.1新增了五种请求方法:OPTIONS,PUT,DELETE,TRACE和CONNECT方法。
    • PUT:从客户端向服务器传送的数据取代指定的文档的内容。
    • DELETE:请求服务器删除指定的页面。
    • CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。
    • OPTIONS:允许客户端查看服务器的性能。
    • TRACE:回显服务器收到的请求,主要用于测试或诊断。

响应消息格式

服务器回答的响应消息包括以下格式:

  • 状态行
  • 消息报头
  • 空行
  • 响应正文

我们同样通过一个具体的响应消息的例子来解析它的格式:

  1. HTTP/1.1 200 OK
  2. Date: Sat 31 Dec 2005 23:59:59 GMT
  3. Content-Type: text/html;charset=ISO-8859-1
  4. Content-Length: 122
  5. (空行)
  6. html…

可以看到:

  • 第1行:状态行。由HTTP协议版本号、状态码、状态消息三部分组成。
  • 第2-4行:消息报头。用来说明客户端要使用的一些附加信息。
  • 第5行:空行。消息报头后面的空行也是必需的。
  • 第6行及以下:响应正文。服务器返回给客户端的文本信息。

Http状态码

上一小节举的例子中,第1行出现了Http状态码,不同的状态码代表不同的含义,分别如下:

  • 1xx:指示信息。表示请求已接收,继续处理。
  • 2xx:成功。表示请求已被成功接收、理解、接受。
  • 3xx:重定向。要完成请求必须进行更进一步的操作。
  • 4xx:客户端错误。请求有语法错误或请求无法实现。
  • 5xx:服务器端错误。服务器未能实现合法的请求。

下面也举一些常见的有代表性的例子:

  • 200 OK:客户端请求成功。
  • 400 Bad Request:客户端请求有语法错误,不能被服务器所理解。
  • 401 Unauthorized:请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用。
  • 403 Forbidden:服务器收到请求,但是拒绝提供服务。
  • 404 Not Found:请求资源不存在,例如输入了错误的URL。
  • 500 Internal Server Error:服务器发生不可预期的错误。
  • 503 Server Unavailable:服务器当前不能处理客户端的请求,一段时间后可能恢复正常。

这样一来我们对HTTP协议应该有了一个宏观的了解,那么接下来我们就可以开始学习如何利用J2EE平台,来进行web开发。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值