第34篇再谈http协议

最新推荐文章于 2024-09-15 12:44:20 发布

hehehaha1123

最新推荐文章于 2024-09-15 12:44:20 发布

阅读量198

点赞数

从打开一个网址说起

当在浏览器中输入一个网址的时候，浏览器会渲染出对应的网页的内容。作为web开发人员来说，应该知道这个过程：

当输入的一个网址为域名的时候，浏览器则根据本机的网关和DNS服务器来解析出访问的真正的IP地址。如果是直接访问IP则直接与服务器通信，发送请求。请求原理简单如下：

(此处只是简单表示下域名解析原理，解析过程比这个复杂的多。)
发送请求的时候会经历TCP三次握手过程（http也是基于TCP的协议），当TCP连接建立成功后，浏览器会根据http协议，把请求的内容封装成请求报文，发送给web服务器.
服务器会根据请求的报文的内容，执行对应的程序和读取对应的文件，按照http协议的规则返回响应内容(包括header和body)。
服务器根据响应头来解析响应的内容，完成html+css+js的渲染和执行。

http协议

HTTP协议是Hyper Text Transfer Protocol（超文本传输协议）的缩写,是用于从万维网（WWW:World Wide Web ）服务器传输超文本到本地浏览器的传送协议。

用简单的话来说，当客户端与服务器端通信的时候，需要传输的内容有（HTML 文件,js+css, 图片,文本, 查询结果等）,http协议把内容传输规范化。可以随便查看下一个http协议的内容：

jquery请求

（上面的图是请求jqury的请求和响应信息）

请求的头信息

  GET /script/jquery.js HTTP/1.1
  Host: common.cnblogs.com
  Connection: keep-alive
  Pragma: no-cache
  Cache-Control: no-cache
  User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36
  Accept: */*
  Referer: http://kb.cnblogs.com/page/130970/
  Accept-Encoding: gzip, deflate, sdch
  Accept-Language: zh-CN,zh;q=0.8,en;q=0.6
  Cookie: __gads=ID=e2f30d616c5344bf:T=1484287454:S=ALNI_MY6vTrW8EvdzER-v1nE-YnGJjxTzA; pgv_pvi=1271870464; __utma=226521935.1402060598.1484617348.1487768840.1487819679.5; __utmz=226521935.1487819679.5.3.utmcsr=bing|utmccn=(organic)|utmcmd=organic|utmctr=c%23%20Semaphore; _ga=GA1.2.1402060598.1484617348

上面有几个重点的信息:

GET /script/jquery.js HTTP/1.1 这个代表请求的方法是GET(常用的有GET,POST,PUT,DELETE),请求的URI为 /script/jquery.js, HTTP的版本信息为1.1
Accept-Encoding: 是浏览器发给服务器,声明浏览器支持的编码类型
Referer: 告诉服务器我是从哪个页面链接过来的
User-Agent: 当前设备的一些信息
Cookie: 客户端存储的信息，一般是登录信息或者其它认证信息

响应头信息

 HTTP/1.1 200 OK
 Server: Tengine
 Content-Type: application/javascript
 Content-Length: 33411
 Connection: keep-alive
 Date: Wed, 20 Jul 2016 02:26:20 GMT
 Vary: Accept-Encoding
 Cache-Control: public,max-age=25920000
 Last-Modified: Fri, 15 Feb 2013 03:06:57 GMT
 Content-Encoding: gzip
 Via: cache14.l2cm12[0,200-0,H], cache10.l2cm12[1,0], kunlun5.cn199[0,200-0,H], kunlun9.cn199[0,0]
 Age: 19461677
 X-Cache: HIT TCP_MEM_HIT dirn:9:763113955
 X-Swift-SaveTime: Fri, 26 Aug 2016 05:18:04 GMT
 X-Swift-CacheTime: 22712896
 Timing-Allow-Origin: *
 EagleId: 3d9a7e0914884432578382004e

HTTP/1.1 200 OK: 这上代表响应http版本和响应状态
Server: 代表响应的服务器的类型，此处为Tengine
Content-Type:响应的类型，此处是 application/javascript，即是js文件
Content-Length: 代表响应的字节数
Content-Encoding:内容的编码方式，此处为gzip

HTTP三点注意事项：

HTTP是无连接：无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求，并收到客户的应答后，即断开连接。采用这种方式可以节省传输时间。
HTTP是媒体独立的：这意味着，只要客户端和服务器知道如何处理的数据内容，任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
HTTP是无状态：HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息，则它必须重传，这样可能导致每次连接传送的数据量增大。另一方面，在服务器不需要先前信息时它的应答就较快。

浏览器

什么是浏览器

看到http协议都是由Chrome浏览器生成和发送的，这里可以把浏览器简单的定义：

浏览器是一个客户端程序，能够发送http协议、解析http响应、渲染html+css+js

捕获浏览器Http协议

浏览器与服务器的通信是基于TCP，发送是请求相关的内容，服务端收到请求会进行解析。基于这个原理，可以用一个用程序监听一个端口，用浏览器访问这个端口（发送数据），来捕获请求的内容。搭建一个winform窗体如下：

当点击开启的时候，运行如下代码：

      var socket = new Socket(AddressFamily.InterNetwork, SocketType.Stream, ProtocolType.Tcp);
      var endPoint = new IPEndPoint(IPAddress.Parse(this.txtIP.Text), int.Parse(txtPort.Text));
      socket.Bind(endPoint);
      socket.Listen(10);
      if (isAutoOpen.Checked)
      {
         //使用默认的浏览器打开
          System.Diagnostics.Process.Start("http://" + this.txtIP.Text + ":" + this.txtPort.Text);
      }
      ThreadPool.QueueUserWorkItem(r =>
      {
          while (true)
          {
              var socketProx = socket.Accept(); //接收数据
              var bytes = new byte[1024 * 1024];
              var len = socketProx.Receive(bytes, 0, bytes.Length, SocketFlags.None);//获得长度
              var httpHeader = Encoding.Default.GetString(bytes, 0, len);//把二进制的数据转成文本
              SetText(httpHeader);//内容的显示
          }

      });

运行程序，会自动打开默认的浏览器，获得当前的ip和随机生成的接口，运行的结果如下：

监控获得内容如下：

    GET / HTTP/1.1
    Host: 10.28.11.43:55882
    Connection: keep-alive
    Upgrade-Insecure-Requests: 1
    User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36
    Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
    Accept-Encoding: gzip, deflate, sdch
    Accept-Language: zh-CN,zh;q=0.8,en;q=0.6

捕获的http的信息，与上面谈到的信息格式是相同的。

响应请求的内容

当请求过来的时候，基于上面的代码，可以给浏览器发送一个信息，在while块里面添加代码：

   while (true)
   {
       var socketProx = socket.Accept(); //接收数据
       var bytes = new byte[1024 * 1024];
       var len = socketProx.Receive(bytes, 0, bytes.Length, SocketFlags.None);
       var httpHeader = Encoding.Default.GetString(bytes, 0, len);
       SetText(httpHeader);

       if (!string.IsNullOrEmpty(httpHeader))
       {
           var httpResponse = "<h1>Hello Http</h1>";
           var sentBytes = Encoding.Default.GetBytes(httpResponse);
           socketProx.Send(sentBytes, 0, sentBytes.Length, SocketFlags.None);
           socketProx.Shutdown(SocketShutdown.Both);
       }

   }

用Chrome请求结果为：

用火狐请求的结果为：

在面对上面的两个浏览器的请求结果时候，可以看到，此时程序已经和浏览器进行了通信。造成上面的两个结果的不同，是没有指定响应的内容，浏览器按照默认的格式进行渲染，所以Chrome认为是html，而FireFox认为是text。

避免上面的结果，可以响应的时候把返回的内容进行约束，即：Content-Type属性。把响应的内容修改如下：

    var httpResponse = "<h1>Hello Http</h1>";
    var sentBytes = Encoding.Default.GetBytes(httpResponse);

    var sb = new StringBuilder();
    sb.AppendLine("HTTP/1.1 200 OK");
    sb.AppendLine("Date:" + DateTime.Now);
    sb.AppendLine("Content-Type:text/html");
    sb.AppendLine("Content-Length:" + sentBytes.Length);
    sb.AppendLine();
    var sentHeader = Encoding.Default.GetBytes(sb.ToString());
    socketProx.Send(sentHeader, 0, sentHeader.Length, SocketFlags.None);//发送内容前，先发送响应的头文件 

    socketProx.Send(sentBytes, 0, sentBytes.Length, SocketFlags.None);
    socketProx.Shutdown(SocketShutdown.Both);

修改后，fireFox响应结果如下：