HTTP报文分析(转载)

一、HTTP请求报文解剖


HTTP请求报文由3部分组成(请求行+请求头+请求体): 

 

下面我们基于socket编写一个简单的HTTP server


   
   
  1. import java.io.BufferedReader;
  2. import java.io.BufferedWriter;
  3. import java.io.IOException;
  4. import java.io.InputStreamReader;
  5. import java.io.OutputStreamWriter;
  6. import java.io.PrintWriter;
  7. import java.net.ServerSocket;
  8. import java.net.Socket;
  9. import java.util.concurrent.Executors;
  10. import java.util.concurrent.ExecutorService;
  11. class SocketHandler implements Runnable
  12. {
  13. final static String CRLF = "\r\n"; // 1
  14. private Socket clientSocket;
  15. public SocketHandler(Socket clientSocket)
  16. {
  17. this.clientSocket = clientSocket;
  18. }
  19. public void handleSocket(Socket clientSocket) throws IOException
  20. {
  21. BufferedReader in = new BufferedReader( new InputStreamReader(clientSocket.getInputStream()));
  22. PrintWriter out = new PrintWriter( new BufferedWriter( new OutputStreamWriter(clientSocket.getOutputStream())),
  23. true);
  24. String requestHeader = "";
  25. String s;
  26. while ((s = in.readLine()) != null)
  27. {
  28. s += CRLF; // 2 很重要,默认情况下in.readLine的结果中`\r\n`被去掉了
  29. requestHeader = requestHeader + s;
  30. if ( s.equals(CRLF) )
  31. {
  32. // 3 此处HTTP请求头我们都得到了;如果从请求头中判断有请求正文,则还需要继续获取数据
  33. break;
  34. }
  35. }
  36. System.out.println( "客户端请求头:");
  37. System.out.println(requestHeader);
  38. String responseBody = "客户端的请求头是:\n" + requestHeader;
  39. String responseHeader = "HTTP/1.0 200 OK\r\n" + "Content-Type: text/plain; charset=UTF-8\r\n"
  40. + "Content-Length: " + responseBody.getBytes().length + "\r\n" + "\r\n";
  41. // 4 问题来了:1、浏览器如何探测编码 2、浏览器受到content-length后会按照什么方式判断?汉字的个数?字节数?
  42. System.out.println( "响应头:");
  43. System.out.println(responseHeader);
  44. out.write(responseHeader);
  45. out.write(responseBody);
  46. out.flush();
  47. out.close();
  48. in.close();
  49. clientSocket.close();
  50. }
  51. @Override
  52. public void run()
  53. {
  54. try
  55. {
  56. ![在这里插入图片描述](https://img-blog.csdnimg.cn/20210504162252531.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDg2NTQ1OA==,size_16,color_FFFFFF,t_70) handleSocket(clientSocket);
  57. }
  58. catch (Exception ex)
  59. {
  60. ex.printStackTrace();
  61. }
  62. }
  63. }
  64. public class MyHTTPServer
  65. {
  66. public static void main(String[] args) throws Exception
  67. {
  68. int port = 8000;
  69. ServerSocket serverSocket = new ServerSocket(port);
  70. System.out.println( "启动服务,绑定端口: " + port);
  71. ExecutorService fixedThreadPool = Executors.newFixedThreadPool( 30); // 5
  72. while ( true)
  73. { // 6
  74. Socket clientSocket = serverSocket.accept();
  75. System.out.println( "新的连接" + clientSocket.getInetAddress() + ":" + clientSocket.getPort());
  76. try
  77. {
  78. fixedThreadPool.execute( new SocketHandler(clientSocket));
  79. }
  80. catch (Exception e)
  81. {
  82. System.out.println(e);
  83. }
  84. }
  85. }
  86. }

启动上面的HTTP Server,然后使用谷歌浏览器访问http://127.0.0.1:8000/,我们可以从浏览器的响应的内容(或者F12>Nettwork>Request Headers)知道我们实际请求的http报文


1.1、请求方法

GET和POST是最常见的HTTP方法,除此以外还包括DELETE、HEAD、OPTIONS、PUT、TRACE。不过,当前的大多数浏览器只支持GET和POST,Spring 3.0提供了一个HiddenHttpMethodFilter,允许你通过“_method”的表单参数指定这些特殊的HTTP方法(实际上还是通过POST提交表单)。服务端配置了HiddenHttpMethodFilter后,Spring会根据_method参数指定的值模拟出相应的HTTP方法,这样,就可以使用这些HTTP方法对处理方法进行映射了。 

HTTP/1.1协议中定义的八中方法:https://blog.csdn.net/qq_38191191/article/details/78671063

1.2、URL

为请求对应的URL地址,它和报文头的Host属性组成完整的请求URL。

1.3、协议版本

是协议名称及版本号。 

1.4、请求头

是HTTP的报文头,报文头包含若干个属性,格式为“属性名:属性值”,服务端据此获取客户端的信息。 

报文头属性是什么东西呢?我们不妨以一个小故事来说明吧。 

快到中午了,张三丰不想去食堂吃饭,于是打电话叫外卖:老板,我要一份[鱼香肉丝],要12:30之前给我送过来哦,我在江湖湖公司研发部,叫张三丰。这里,你要[鱼香肉丝]相当于HTTP报文体,而“12:30之前送过来”,你叫“张三丰”等信息就相当于HTTP的报文头。它们是一些附属信息,帮忙你和饭店老板顺利完成这次交易。 
请求HTTP报文和响应HTTP报文都拥有若干个报文关属性,它们是为协助客户端及服务端交易的一些附属信息。 

常见的HTTP请求报文头属性 
Accept
请求报文可通过一个“Accept”报文头属性告诉服务端 客户端接受什么类型的响应。 
如下报文头相当于告诉服务端,俺客户端能够接受的响应类型仅为纯文本数据啊,你丫别发其它什么图片啊,视频啊过来,那样我会歇菜的~~~

Accept:text/plain  
Accept属性的值可以为一个或多个MIME类型的值,关于MIME类型,大家请参考:http://en.wikipedia.org/wiki/MIME_type
Cookie
客户端的Cookie就是通过这个报文头属性传给服务端的哦!如下所示: 

Cookie: $Version=1; Skin=new;jsessionid=5F4771183629C9834F8382E23BE13C4C

服务端是怎么知道客户端的多个请求是隶属于一个Session呢?注意到后台的那个jsessionid=5F4771183629C9834F8382E23BE13C4C木有?原来就是通过HTTP请求报文头的Cookie属性的jsessionid的值关联起来的!(当然也可以通过重写URL的方式将会话ID附带在每个URL的后面哦)。 
Referer 
表示这个请求是从哪个URL过来的,假如你通过google搜索出一个商家的广告页面,你对这个广告页面感兴趣,鼠标一点发送一个请求报文到商家的网站,这个请求报文的Referer报文头属性值就是http://www.google.com。 
Cache-Control 
对缓存进行控制,如一个请求希望响应返回的内容在客户端要被缓存一年,或不希望被缓存就可以通过这个报文头达到目的。 
如以下设置,相当于让服务端将对应请求返回的响应内容不要在客户端缓存: Cache-Control: no-cache  
其它请求报文头属性 
参见:http://en.wikipedia.org/wiki/List_of_HTTP_header_fields
如何访问请求报文头
由于请求报文头是客户端发过来的,服务端当然只能读取了,以下是HttpServletRequest一些用于读取请求报文头的API: 


   
   
  1. //获取请求报文中的属性名称
  2. java.util.Enumeration<java.lang.String> getHeaderNames();
  3. //获取指定名称的报文头属性的值
  4. java.lang. String getHeader(java.lang.String name)

由于一些请求报文头属性“太著名”了,因此HttpServletRequest为它们提供了VIP的API: 


   
   
  1. //获取报文头中的Cookie(读取Cookie的报文头属性)
  2. Cookie[] getCookies() ;
  3. //获取客户端本地化信息(读取 Accept-Language 的报文头属性)
  4. java.util. Locale getLocale()
  5. //获取请求报文体的长度(读取Content-Length的报文头属性)
  6. int getContentLength ();

HttpServletRequest可以通过getSession()获取请求所关联的HttpSession,其内部的机理是通过读取请求报文头中Cookie属性的JSESSIONID的值,在服务端的一个会话Map中,根据这个JSESSIONID获取对应的HttpSession的对象。(这样,你就不会觉得HttpSession很神秘了吧,你自己也可以做一个类似的会话管理  ) 

1.5、报文体

它将一个页面表单中的组件值通过param1=value1&param2=value2的键值对形式编码成一个格式化串,它承载多个请求参数的数据。不但报文体可以传递请求参数,请求URL也可以通过类似于“/chapter15/user.html? param1=value1&param2=value2”的方式传递请求参数。 
对照上面的请求报文,我们把它进一步分解,你可以看到一幅更详细的结构图: 

 


二、HTTP响应报文解剖

HTTP的响应报文也由三部分组成(响应行+响应头+响应体): 

以下是一个实际的HTTP响应报文: 


2.1、响应状态码

和请求报文相比,响应报文多了一个“响应状态码”,它以“清晰明确”的语言告诉客户端本次请求的处理结果。 
HTTP的响应状态码由5段组成: 

  • 1xx 消息,一般是告诉客户端,请求已经收到了,正在处理,别急...
  • 2xx 处理成功,一般表示:请求收悉、我明白你要的、请求已受理、已经处理完成等信息.
  • 3xx 重定向到其它地方。它让客户端再发起一个请求以完成整个处理。
  • 4xx 处理发生错误,责任在客户端,如客户端的请求一个不存在的资源,客户端未被授权,禁止访问等。
  • 5xx 处理发生错误,责任在服务端,如服务端抛出异常,路由出错,HTTP版本不支持等。

以下是几个常见的状态码: 

200 OK 你最希望看到的,即处理成功!
303 See Other 我把你redirect到其它的页面,目标的URL通过响应报文头的Location告诉你。 
304 Not Modified 告诉客户端,你请求的这个资源至你上次取得后,并没有更改,你直接用你本地的缓存吧,我很忙哦,你能不能少来烦我啊! 
404 Not Found 你最不希望看到的,即找不到页面。如你在google上找到一个页面,点击这个链接返回404,表示这个页面已经被网站删除了,google那边的记录只是美好的回忆。 
500 Internal Server Error 看到这个错误,你就应该查查服务端的日志了,肯定抛出了一堆异常,别睡了,起来改BUG去吧! 


其它的状态码参见:http://en.wikipedia.org/wiki/List_of_HTTP_status_codes
有些响应码,Web应用服务器会自动给生成。你可以通过HttpServletResponse的API设置状态码: 


   
   
  1. //设置状态码,状态码在HttpServletResponse中通过一系列的常量预定义了,如SC_ACCEPTED,SC_OK
  2. void setStatus(int sc)

2.2、常见的HTTP响应报文头属性

Cache-Control
响应输出到客户端后,服务端通过该报文头属告诉客户端如何控制响应内容的缓存。 
下面,的设置让客户端对响应内容缓存3600秒,也即在3600秒内,如果客户再次访问该资源,直接从客户端的缓存中返回内容给客户,不要再从服务端获取(当然,这个功能是靠客户端实现的,服务端只是通过这个属性提示客户端“应该这么做”,做不做,还是决定于客户端,如果是自己宣称支持HTTP的客户端,则就应该这样实现)。 Cache-Control: max-age=3600  

ETag 
一个代表响应服务端资源(如页面)版本的报文头属性,如果某个服务端资源发生变化了,这个ETag就会相应发生变化。它是Cache-Control的有益补充,可以让客户端“更智能”地处理什么时候要从服务端取资源,什么时候可以直接从缓存中返回响应。 
关于ETag的说明,你可以参见:http://en.wikipedia.org/wiki/HTTP_ETag。 
Spring 3.0还专门为此提供了一个org.springframework.web.filter.ShallowEtagHeaderFilter(实现原理很简单,对JSP输出的内容MD5,这样内容有变化ETag就相应变化了),用于生成响应的ETag,因为这东东确实可以帮助减少请求和响应的交互。 
下面是一个ETag: ETag:"737060cd8c284d8af7ad3082f209582d"
Location
我们在JSP中让页面Redirect到一个某个A页面中,其实是让客户端再发一个请求到A页面,这个需要Redirect到的A页面的URL,其实就是通过响应报文头的Location属性告知客户端的,如下的报文头属性,将使客户端redirect到iteye的首页中: Location:https://blog.csdn.net/qq_26565861
Set-Cookie 
服务端可以设置客户端的Cookie,其原理就是通过这个响应报文头属性实现的: 

Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1  

其它HTTP响应报文头属性 
更多其它的HTTP响应头报文,参见:http://en.wikipedia.org/wiki/List_of_HTTP_header_fields 
如何写HTTP请求报文头 
在服务端可以通过HttpServletResponse的API写响应报文头的属性:


   
   
  1. //添加一个响应报文头属性
  2. void setHeader(String name, String value)

象Cookie,Location这些响应都是有福之人,HttpServletResponse为它们都提供了VIP版的API: 


   
   
  1. //添加Cookie报文头属性
  2. void addCookie(Cookie cookie)
  3. //不但会设置Location的响应报文头,还会生成303的状态码呢,两者天仙配呢
  4. void sendRedirect (String location)

 

 

参考https://blog.csdn.net/u010256388/article/details/68491509

 

原文链接: [HTTP报文分析](https://blog.csdn.net/qq_26565861/article/details/80969960?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_utm_term-0&spm=1001.2101.3001.4242)
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值