JavaServlet之http协议详解

http://localhost:8080/myweb/index.jsp

http : 表示数据传输的协议

localhost : 主机名或IP

8080 : 端口号

myweb : 服务器上的一个web应用

index.jsp : web 应用下的资源


HTTP请求:
客户端连上服务器后,向服务器请求某个web资源,这就是客户端向服务器发送了一个http请求。
一个完整的http请求包括如下内容:Request:
1. 请求行
2. 请求头(多个)
3. 请求体内容


如下所示:
GET /myweb/index.jsp HTTP/1.1 
Accept: application/x-ms-application, image/jpeg, application/xaml+xml, image/gif, image/pjpeg, application/x-ms-xbap, */*
Accept-Language: zh-CN
User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET4.0C; .NET4.0E; BRI/2; NP06)
Accept-Encoding: gzip, deflate
If-Modified-Since: Wed, 24 Apr 2013 07:49:11 GMT
If-None-Match: W/"240-1366789751997"
Host: localhost:8080
Connection: Keep-Alive


xxxxxxxxxxxxxxxx这是请求体的内容


------------------------------------------------------------

请求行的讲解:
请求方式get和post的区别:
1. get提交的数据写在请求行里面,而post提交的数据写在请求体内容里面。
2. GET提交的数据大小有限制(因为浏览器对URL的长度有限制),而POST方法提交的数据没有限制.
3. GET方式需要使用Request.getQueryString()来取得变量的值,而POST方式通过Request.getParameter(attr)来获取变量的值。
4. GET方式提交数据,会带来安全问题,比如一个登录页面,通过GET方式提交数据时,用户名和密码将出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获得该用户的账号和密码.


/TestServlet/1.html 请求资源的名称


HTTP/1.1 当前用的http版本,相对于http/1.0,客户端每次请求连接上服务器,得到相应后,并不会马上断开,而是保持一定时间的连接,这个可由web服务器配置

------------------------------------------------------------


请求头的讲解:
Accept: 用于告诉服务器,客户端支持的数据类型


Accept-Charset: 用于告诉服务器,客户端使用的编码


Accept-Encoding:浏览器申明自己接收的编码方法,通常指定压缩方法,是否支持压缩,支持什么压缩方法(gzip,deflate),(注意:这不是字符编码); 

Accept-Encoding: gzip, deflate


Accept-Language: 用于告诉服务器,客户端使用的语言环境[ Internet选项 -> 常规 -> 语言 ]
zh-CN: 中文下的中国[zh中文,CN中国]


Host: 客户端通过这个头知道要连接的服务器,想访问的主机名


If-Modified-Since: 客户机通过这个头告诉服务器,资源的缓存时间。[这是与缓存相关的请求头]
浏览器端缓的存页面的最后修改时间发送到服务器去,服务器会把这个时间与服务器上实际文件的最后修改时间进行对比。如果时间一致,那么如果服务器返回304,客户端就直接使用本地缓存文件。如果时间不一致,就会返回200和新的文件内容。客户端接到之后,会丢弃旧文件,把新文件缓存起来,并显示在浏览器中.

例如:If-Modified-Since: Thu, 09 Feb 2012 09:07:57 GMT


Referer: 客户端通过这个头告诉服务器,它是从哪个资源来访问服务器的。[常用作防盗链]
比如在1.html页面里写一个超链接如下:<a href="/myweb/index.jsp">转到</a>
当点击了“转到”之后,就会从1.html页面跳转到index.jsp页面,此时的Referer就是1.html页面。


User-Agent: 客户端通过这个头告诉服务器,客户端的软件环境
告诉HTTP服务器, 客户端使用的操作系统和浏览器的名称和版本.
我们上网登陆论坛的时候,往往会看到一些欢迎信息,其中列出了你的操作系统的名称和版本,你所使用的浏览器的名称和版本,这往往让很多人感到很神奇,实际上,服务器应用程序就是从User-Agent这个请求报头域中获取到这些信息User-Agent请求报头域允许客户端将它的操作系统、浏览器和其它属性告诉服务器。
例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)


Cookie: 最重要的header,将cookie的值发送给http服务器


Connection: Keep-Alive/close
从HTTP/1.1起,默认都开启了Keep-Alive,保持连接特性,简单地说,当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接
Keep-Alive不会永久保持连接,它有一个保持时间,可以在不同的服务器软件(如Apache)中设定这个时间


------------------------------------------------------------


请求体内容放的是post提交的数据


------------------------------------------------------------
HTTP响应:
一个http响应代表服务器向客户端回送的数据。
http响应分为三部分:
1. 响应头
2. 响应行
3. 响应内容


示例:
HTTP/1.1 200 OK
Server: Apache-Coyote/1.1
Accept-Ranges: bytes
ETag: W/"227-1366860283494"
Last-Modified: Thu, 25 Apr 2013 03:24:43 GMT
Content-Type: text/html
Content-Length: 227
Date: Thu, 25 Apr 2013 06:06:39 GMT




<a href="/myweb/2.html">Click</a>


<form action="/myweb/my" method="post">
username: <input type="text" name="username" /> <br/>
<input type="submit" value="submit" />
</form>






------------------------------------------------------------


1. 响应头
HTTP/1.1 200 OK


200是状态码
状态码用于表示服务器对请求的处理结果,它是一个三位的十进制数。
HTTP/1.1中定义了5类状态码, 状态码由三位数字组成,第一个数字定义了响应的类别:
1XX[100~199]  提示信息 - 表示请求已被成功接收,继续处理。[不常用]


2XX[200~299]  成功 - 表示请求已被成功接收。[常用的是200]


3XX[300~399]  重定向 - 要完成请求必须进行更进一步的处理。
              302表示重定向,服务器让客户端去访问另外一个web资源。
              304和307表示服务器让客户端去拿缓存里的数据。


4XX[400~499]  客户端错误,请求有语法错误或请求无法实现。
              404表示客户端输入的网址错误,比如 http://localhost:8080/xxxxxxxxxxxx
              403表示服务器拒绝访问,一般是权限的问题


5XX[400~499]  服务器端错误,服务器未能实现合法的请求。[常用的是500]


------------------------------------------------------------


2. 响应头


Location: 用于重定向一个新的URL位置,该响应头配合302状态码使用。
Servlet示例写响应头Location:
protected void doGet(HttpServletRequest request,
HttpServletResponse response) throws ServletException, IOException {
response.setStatus(302);
response.setHeader("location", "/myweb/2.html");
}


Server: 服务器通过这个响应头,告诉客户端当前服务器的类型。


Content-Encoding: 服务器通过这个响应头,告诉客户端自已使用了什么压缩方式来压缩响应中的对象(gzip, deflate)
这里深入讲解一个问题,为什么服务器要将传送给客户端的数据先压缩之后再传送呢?
原因之一、压缩之后数据变小了,客户端的接收速度快了。
原因之二、现在的网站都是按流量收费的,也就是说网站给电信公司交钱是按照网站的出口流量收费的,对于网站本身而言,流量减少就意味着节省开支。

压缩可使用GZIPOutputStream()这个流实现。




Content-Length: 服务器通过这个响应头告诉客户端发送数据的长度。


Content-Language: 服务器告诉客户端自已响应对象的语言环境。


Content-Type: 服务器告诉客户端自已响应对象的类型以及使用的字符集。
              服务器发送0101二进制数据给客户端浏览器,浏览器怎么知道应该以怎么样的方式显示数据?(比如:是以图片的方式显示呢,还是以文字的方式显示呢?)
              此时就要服务器发送一个响应头Content-Type给客户端,让客户端知道怎么解码二进制数据,怎么显示解码后的数据了。
     例如:
     Content-Type: text/html; charset=utf-8
     Content-Type:text/html;charset=GB2312
     Content-Type: image/jpeg

      Content-Type: image/bmp




              在Tomcat/conf/web.xml文件里有对各种类型数据的定义
              使用Content-Type示例:
protected void doGet(HttpServletRequest request,
HttpServletResponse response) throws ServletException, IOException {
response.setHeader("Content-Type", "image/bmp");

InputStream in = this.getServletContext().getResourceAsStream("1.bmp");
OutputStream out = response.getOutputStream();
int len = 0;
byte[] buf = new byte[1024];
while((len = in.read(buf)) != -1) {
out.write(buf, 0, len);
}
in.close();
}


Last-Modified: 服务器通过这个响应头告诉客户端浏览器当前资源的最后的修改时间
    在浏览器第一次请求某一个URL时,服务器端的返回状态会是200,内容是你请求的资源,同时有一个Last-Modified的属性标记此文件在服务期端最后被修改的时间,格式类似这样:
  Last-Modified: Fri, 12 May 2006 18:53:33 GMT
  客户端第二次请求此URL时,根据 HTTP 协议的规定,浏览器会向服务器传送 If-Modified-Since 报头,询问该时间之后文件是否有被修改过:
  If-Modified-Since: Fri, 12 May 2006 18:53:33 GMT
  如果服务器端的资源没有变化,则自动返回 HTTP 304 (Not Changed.)状态码,内容为空,这样就节省了传输数据量。当服务器端代码发生改变或者重启服务器时,则重新发出资源,返回和第一次请求时类似。从而保证不向客户端重复发出资源,也保证当服务器有变化时,客户端能够得到最新的资源。


Refresh: 服务器通过这个响应头告诉客户端浏览器,隔多长时间刷新一次
protected void doGet(HttpServletRequest request,
HttpServletResponse response) throws ServletException, IOException {
response.setHeader("Refresh", "3"); // 每隔3秒刷新一次
response.getOutputStream().write("xxxxxx".getBytes());
}
这种自动刷新功能用于聊天室比较多,还有股票网站。
还可以指定刷新到某个URL地址:response.setHeader("Refresh", "3;url='http://www.hao123.com'"); // 每隔3秒刷新一次,刷新后的网址是http://www.hao123.com




Content-Disposition: 服务器通过这个响应头告诉客户端浏览器,以下载方式来打开数据
protected void doGet(HttpServletRequest request,
HttpServletResponse response) throws ServletException, IOException {
response.setHeader("Content-Disposition", "attachment;filename=1.bmp");

InputStream in = this.getServletContext().getResourceAsStream("1.bmp");
OutputStream out = response.getOutputStream();
int len = 0;
byte[] buf = new byte[1024];
while((len = in.read(buf)) != -1) {
out.write(buf, 0, len);
}
in.close();
}




Transfer-Encoding: 服务器通过这个响应头告诉客户端浏览器数据的传送格式
  Transfer-Encoding: chunked 表示一块一块传送
  分块编码有利于一边进行压缩一边发送数据,而不是先完成压缩过程以得知压缩后数据的大小。


ETag: 缓冲相关的头[难点]


Expires: 服务器通过这个响应头告诉客户端浏览器,资源缓存多长时间(0或-1则是不缓存)


Cache-Control: no-cache 或 Pragma: no-cache
服务器通过这两个响应头告诉客户端浏览器,也就是控制浏览器不要缓存数据。
以上两个响应头都可以让浏览器不要缓存数据,那有什么区别呢?
不同的浏览器对于不同的响应头的支持不同,为了让全部的浏览器都能做到不缓存数据,最好把这两个都写上去,再加上一个Expires:-1就更完美了。


Connection: Keep-Alive/close
























评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值