关闭

HTTP协议初识

标签: http协议Servlet
429人阅读 评论(0) 收藏 举报
分类:

HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP,使HTTP客户(如Web浏览器)能够从HTTP服务器(Web服务器)请求信息和服务,HTTP目前协议的版本是1.1。

HTTP是一种无状态的协议,无状态是指Web浏览器和Web服务器之间不需要建立持久的连接,这意味着当一个客户端向服务器端发出请求,然后Web服务器返回响应(response),连接就被关闭了,在服务器端不保留连接的有关信息。

HTTP遵循请求(Request)/应答(Response)模型。Web浏览器向Web服务器发送请求,Web服务器处理请求并返回适当的应答。所有HTTP连接都被构造成一套请求和应答。


HTTP通信机制是在一次完整的HTTP通信过程中,Web浏览器与Web服务器之间将完成下列7个步骤:

1、建立TCP连接

在HTTP工作开始之前,Web浏览器首先要通过网络与Web服务器建立连接,该连接是通过TCP来完成的,该协议与IP协议共同构建Internet,即著名的TCP/IP协议族,因此Internet又被称作是TCP/IP网络。HTTP是比TCP更高层次的应用层协议,根据规则,只有低层协议建立之后才能,才能进行更层协议的连接,因此,首先要建立TCP连接,一般TCP连接的端口号是80

2、Web浏览器向Web服务器发送请求命令
一旦建立了TCP连接,Web浏览器就会向Web服务器发送请求命令
例如:GET/sample/hello.jsp HTTP/1.1

3、Web浏览器发送请求头信息
浏览器发送其请求命令之后,还要以头信息的形式向Web服务器发送一些别的信息,之后浏览器发送了一空白行来通知服务器,它已经结束了该头信息的发送。

4、 Web服务器应答
客户机向服务器发出请求后,服务器会客户机回送应答,
HTTP/1.1 200 OK
应答的第一部分是协议的版本号和应答状态码

5、 Web服务器发送应答头信息
正如客户端会随同请求发送关于自身的信息一样,服务器也会随同应答向用户发送关于它自己的数据及被请求的文档。

6、Web服务器向浏览器发送数据
Web服务器向浏览器发送头信息后,它会发送一个空白行来表示头信息的发送到此为结束,接着,它就以Content-Type应答头信息所描述的格式发送用户所请求的实际数据

7、Web服务器关闭TCP连接
一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码
Connection:keep-alive
TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。

HTTP请求格式
当浏览器向Web服务器发出请求时,它向服务器传递了一个数据块,也就是请求信息,HTTP请求信息由3部分组成:
  • 请求方法URI协议/版本
  •  请求头(Request Header)
  • 请求正文

下面是一个HTTP请求的例子:
GET/sample.jspHTTP/1.1
Accept:image/gif.image/jpeg,*/*
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
Accept-Encoding:gzip,deflate
 
username=jinqiao&password=1234
 
1、 请求方法URI协议/版本
请求的第一行是“方法URL议/版本”:GET/sample.jsp HTTP/1.1
以上代码中“GET”代表请求方法,“/sample.jsp”表示URI,“HTTP/1.1代表协议和协议的版本。
根据HTTP标准,HTTP请求可以使用多种请求方法。例如:HTTP1.1支持7种请求方法:GET、POST、HEAD、OPTIONS、PUT、DELETE和TARCE。在Internet应用中,最常用的方法是GET和POST。
URL完整地指定了要访问的网络资源,通常只要给出相对于服务器的根目录的相对目录即可,因此总是以“/”开头,最后,协议版本声明了通信过程中使用HTTP的版本。

2、请求头(Request Header)
请求头包含许多有关的客户端环境和请求正文的有用信息。例如,请求头可以声明浏览器所用的语言,请求正文的长度等。
Accept:image/gif.image/jpeg.*/*
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible:MSIE5.01:Windows NT5.0)
Accept-Encoding:gzip,deflate.

3、请求正文
请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文。请求正文中可以包含客户提交的查询字符串信息:
username=jinqiao&password=1234
在以上的例子的HTTP请求中,请求的正文只有一行内容。当然,在实际应用中,HTTP请求正文可以包含更多的内容。

HTTP请求方法我这里只讨论GET方法与POST方法
 GET方法:
GET方法是默认的HTTP请求方法,我们日常用GET方法来提交表单数据,然而用GET方法提交的表单数据只经过了简单的编码,同时它将作为URL的一部分向Web服务器发送,因此,如果使用GET方法来提交表单数据就存在着安全隐患上。例如
Http://127.0.0.1/login.jsp?Name=zhangshi&Age=30&Submit=%cc%E+%BD%BB
从上面的URL请求中,很容易就可以辩认出表单提交的内容。(?之后的内容)另外由于GET方法提交的数据是作为URL请求的一部分所以提交的数据量不能太大

POST方法:
POST方法是GET方法的一个替代方法,它主要是向Web服务器提交表单数据,尤其是大批量的数据。POST方法克服了GET方法的一些缺点。通过POST方法提交表单数据时,数据不是作为URL请求的一部分而是作为标准数据传送给Web服务器,这就克服了GET方法中的信息无法保密和数据量太小的缺点。因此,出于安全的考虑以及对用户隐私的尊重,通常表单提交时采用POST方法。
  从编程的角度来讲,如果用户通过GET方法提交数据,则数据存放在QUERY_STRING环境变量中,而POST方法提交的数据则可以从标准输入流中获取。
HTTP应答与HTTP请求相似,HTTP响应也由3个部分构成,分别是:
  • 协议状态版本代码描述
  • 响应头(Response Header)
  • 响应正文
下面通过一个例子来说明如何通过Java通过get方式来获得页面
/**
 * HTTP协议基础测试
 * 本程序是用get方式将Tomcat首页的页面源代码拿下来
 * 用此方法,我们可以将我们访问到的页面的内容都拿下来
 * 
 */

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.PrintWriter;
import java.net.Socket;
import java.net.UnknownHostException;

public class TestHttp {

    public static void main(String[] args) {
        
        Socket s = null;
        PrintWriter pw = null;
        BufferedReader br = null;
            
        try {
            // 建立连接端口,s指向本地机器Tomcat服务器端口上
            s = new Socket("127.0.0.1",8080);
            
            // 对于本程序而言是输出,则相当于是准备向Tomcat服务器端口写请求
            pw = new PrintWriter(new OutputStreamWriter(s.getOutputStream()));
            
            // 请求访问页面(此处等同于访问http://localhost:8888/)    
            pw.println("GET / HTTP/1.1");
            pw.println("Host: localhost");
            pw.println("Content-Type:text/html");
            pw.println("");
            // 上一句表示请求内容结束
            pw.flush();
            // 上面这一段用于本程序向Tomcat服务器发出访问请求(get)
            
            
            // 服务器端作出响应,对于本程序而言是输入
            br = new BufferedReader(new InputStreamReader(s.getInputStream()));
            String str = "";
            // 将服务器端的响应信息打印输出(即将http://localhost:8888/页面代码源文件中的内容输出)
            // 用此方法,我们可以将我们访问到的页面的内容都拿下来
            while((str = br.readLine()) != null) {
                System.out.println(str);
            }
            
        } catch (UnknownHostException e) {
            System.out.println("未知的主机异常");
            e.printStackTrace();
        } catch (IOException e) {
            System.out.println("IO异常");
            e.printStackTrace();
        } finally {
            try {
                if (br != null) {
                    br.close();
                    br = null;
                }
                if (pw != null) {
                    pw.close();
                    pw = null;
                }
                if (s != null) {
                    s.close();
                    s = null;
                }
            } catch (IOException e) {
                System.out.println("IO异常");
                e.printStackTrace();
            }            
        }
    }

}

运行后的结果:


0
0
查看评论

HTTP协议 (1)初识HTTP

HTTP协议,全称超文本传输协议,是使用范围最广的一种网络协议,所有的www文件都要遵守这个协议。 协议主要是客户端与服务端的请求与应答的过程。 在生活中最常见的就是通浏览器和服务器,浏览器就是客户端,服务器就是服务端。 访问百度的时候,浏览器向百度的服务器发送一个请求(Request),服务器接受...
  • qq_33669549
  • qq_33669549
  • 2016-04-22 19:44
  • 4892

Http协议初识第二天

URL格式: –http://host[: port] [abs_path] –其中http表示要通过HTTP协议来定位网络资源。 –Host表示合法的Internet主机域名或IP地址(以点分十进制格式表示) –Port用于指定一个端口号,拥有被请求资源的服务器主机监听该端...
  • fql_zlyy
  • fql_zlyy
  • 2012-11-01 15:31
  • 423

初识HTTP协议(七)

这一次讲一下HTTP协议的缺点。 (一)安全性 HTTP协议中有可能存在信息窃听或身份伪装等安全问题,比如爬虫就可以伪装成浏览器来 进行数据爬取。 HTTP协议主要有下列一些缺点: 1.通信使用明文(不加密),内容可能会被窃听 2.不验证通信方的身份,因此有可能遭遇伪装 3.无法证明报...
  • huangguangyourena
  • huangguangyourena
  • 2018-02-05 17:47
  • 52

初识HTTP协议

初识HTTP协议HTTP协议介绍HTTP(HyperText Transfer Protocol)超文本传输协议,是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准。http协议由于其简单高效以及无状态所以迅速流行起来了,但是随着web应用的发展也暴露出部分缺点了。http是基...
  • nicewuranran
  • nicewuranran
  • 2016-06-25 23:15
  • 450

HTTP协议初识

超文本传输协议(英文:HyperText Transfer Protocol,缩写:HTTP)是互联网上应用最为广泛的一种网络协议。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。通过HTTP或者HTTPS协议请求的资源由统一资源标识符(Uniform Resource Ide...
  • zhu752050240
  • zhu752050240
  • 2015-10-12 17:30
  • 190

初识HTTP协议(四)

1.状态码 状态码就是用来告知从服务器端返回的请求结果,通过状态码,用户可以知道服务器端是正常处理了 请求,还是出现了错误。 状态码的构成:状态码由三位数字和原因短语组成。 状态码中的数字的第一位指定了响应类别,一共有五类: 1XX(信息性状态码),表示接受的请求正在处理 2XX(成功状...
  • huangguangyourena
  • huangguangyourena
  • 2018-02-04 14:37
  • 9

Http协议初识第一天

Http是基于请求和响应的 无状态 的协议。 问题: Http1.0中,当连接建立后,浏览器发送一个请求,服务器回应一个消息,之后,连接就被关闭 所以当在发送一个请求时,服务器将需要重新建立连接,很显然这种需要不断建立连接的通信方式 开销比较大 但是,每获取一种...
  • fql_zlyy
  • fql_zlyy
  • 2012-11-01 15:28
  • 447

初识http协议

HTTP是一个属于应用层的面向对象的协议,HTTP协议的主要特点可概括如下: 1.支持客户/服务器模式。 2.简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的...
  • twodark
  • twodark
  • 2012-11-20 20:13
  • 84

初识HTTP协议(五)

终于看到代理啦,之前因为学爬虫,看到代理的时候懵懵懂懂,果然还是先学习一下HTTP吧,毕竟  菜鸟。 (一) 1.什么是代理 代理就是一种具有转发功能的应用程序,它扮演了位于服务器和客户端中间人的角色,接收由客户端发送的请求 并转发给服务器,同时也接收服务器返回的响应并转发给客户...
  • huangguangyourena
  • huangguangyourena
  • 2018-02-04 15:30
  • 36

初识HTTP协议(三)

1.管线化技术(pipelining),在上一篇中我们提到持久连接。  由于在持久连接出现之前,客户端每发送一次请求得到响应后就要中断一次TCP连接,这样就导致了我们  无法并行发送多个请求,因为只有在等待上一个请求结束后才可以继续发送请求。  持久连接使得多数请...
  • huangguangyourena
  • huangguangyourena
  • 2018-02-04 14:07
  • 24
    个人资料
    • 访问:26141次
    • 积分:1299
    • 等级:
    • 排名:千里之外
    • 原创:103篇
    • 转载:14篇
    • 译文:0篇
    • 评论:2条
    文章分类
    最新评论