</pre>HTTP协议<p></p><p><span style="font-size:18px">一.HTTP协议基础</span></p><p><span style="font-size:14px">1.定义</span>:HTTP是基于TCP连接的浏览器与服务器通信协议。(即传输层先用TCP三次握手建立连接,进而HTTP通信)</p><p><span style="font-size:14px">2.连接原理</span>:先进行TCP建立端到端连接,然后发送和接受HTTP报文。TCP(Socket)是端到端的连接,通过IP地址和端口号用于定位网络上两台主机的具体运行程序。所以HTTP连接会先启动TCP连接来建立与服务器软件的连接,然后发送和接受HTTP报文内容。</p><p>所以当运行抓包器,打开网页时,会看到一个TCP连接和HTTP连接。在用HTTP 1.0版本时,每打开一个网页就会TCP连接一次。而TCP的每次连接都消耗系统资源(包括CPU和内存)。HTTP1.1版本的TCP连接时持续连接,及请求头默认设置KEEP-ALive=TRUE。这种情况用一份TCP连接传输多次请求。</p><p><span style="font-size:14px">3.模拟发送/响应HTTP报文</span></p><p>故:完全可以用Java Socket编写程序模仿客户端浏览器发送http请求。当然,即可实现客户端软件的文件下载功能。</p><p>代码如下:</p><p></p><pre code_snippet_id="1802010" snippet_file_name="blog_20160802_2_2401736" name="code" class="java">try { <span style="color:#ff0000;"><strong>//模拟发送http请求</strong></span>
Socket s = new Socket(InetAddress.getLocalHost(), 8080);
OutputStreamWriter osw = new OutputStreamWriter(s.getOutputStream());
StringBuffer sb = new StringBuffer();
sb.append("GET /HttpStream/gb2312.jsp HTTP/1.1\r\n");
sb.append("Host: localhost:8088\r\n");
sb.append("Connection: Keep-Alive\r\n");
//注,这是关键的关键,忘了这里让我搞了半个小时。这里一定要一个回车换行,表示消息头完,不然服务器会等待
sb.append("\r\n");
osw.write(sb.toString());
osw.flush();
<strong><span style="color:#ff0000;">//模拟读取HTTP响应 </span></strong>
InputStream is = s.getInputStream();
String line = null;
int contentLength = 0;//服务器发送回来的消息长度
// 读取所有服务器发送过来的请求参数头部信息
do {
line = readLine(is, 0);
//如果有Content-Length消息头时取出
if (line.startsWith("Content-Length")) {
contentLength = Integer.parseInt(line.split(":")[1].trim());
}
//打印请求部信息
System.out.print(line);
//如果遇到了一个单独的回车换行,则表示请求头结束
} while (!line.equals("\r\n"));
//--输消息的体
System.out.print(readLine(is, contentLength));
//关闭流
is.close();
} catch (UnknownHostException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
//readLine()方法实现未给出,因为我感觉那个读取方法的效率不高。有兴趣可参考原作者代码。
(代码转自http://blog.csdn.net/a9529lty/article/details/7174265,感谢原作者)
2.关于http文件上传和下载
Socket模拟HTTP上传文件代码
<span style="font-size:12px;">try {
File file=new File("c:/雪狼突击队.jpg");
//将文件读成字符串
String picString=readFileAsString(file.toString());
//URLEncode
picString="picdata="+URLEncoder.encode(picString, "UTF-8");
String url="http://localhost:8080/Test/index.jsp?uid=1&username=test&auth=098f6bcd4621d373cade4e832627b4f6";
Socket socket =new Socket(InetAddress.getByName(url),80);
DataOutputStream dos=new DataOutputStream(socket.getOutputStream());
String message=""
+"POST "+url+" HTTP/1.1 \r\n "
+"Host: test.lingye.com \r\n "+"Accept: */* \r\n "
+"Cache-Control:no-cache \r\n" +"User-Agent: MSIE6.0; \r\n "
+"Content-Type: application/x-www-form-urlencoded \r\n "
+"Content-Length: "+picString.length()+" \r\n "
+"Connection: Close \r\n\r\n"//报头以两个\n作为结束标志
+picString+"\r\n ";//post数据
byte buffer[]=message.getBytes();
dos.write(buffer);
dos.flush();
dos.close();
//以上只进行了发送操作
socket.close();
} catch (Exception e) {
e.printStackTrace();
}
}</span>
<span style="font-size:12px;"></span><pre style="white-space: normal; font-size: 14px; line-height: 21px;"><pre name="code" class="java"><span style="color:#464646;background-color: rgb(234, 247, 253);">//服务器端
public void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
String </span><span style="color:#ff0000;background-color: rgb(234, 247, 253);"><strong><u>picdata</u></strong></span><span style="color: rgb(70, 70, 70); background-color: rgb(234, 247, 253);">=request.getParameter("</span><span style="color: rgb(70, 70, 70); background-color: rgb(255, 0, 0);"><strong>picdata</strong></span><span style="background-color: rgb(234, 247, 253);"><span style="color:#464646;">");//</span><span style="color:#ff0000;"><strong>注意这里的picData是图片对应的Encode编码方式,同一个编码和同一个解码方式</strong></span><span style="color:#464646;">
BASE64Decoder base64=new BASE64Decoder();
//64位解码
byte[] buffer=base64.decodeBuffer(picdata);
//写进文件
FileOutputStream fos=new FileOutputStream("c:/雪狼突击队1.jpg");
fos.write(buffer);
fos.flush();
fos.close();
fos=null;
}</span></span>
(代码转自http://blog.sina.com.cn/s/blog_5da93c8f0100vj3v.html,感谢作者)
以上可以看出,Java语言可以编写浏览器,当然浏览器功能很复杂。浏览器对http响应的html代码进行解析,就形成了我们看到的网页。
注意看socket模拟http请求和响应的方法,可以看出读取输入流/输出流都是在一个socket连接中获得的,即每次TCP连接(3次握手后),都会有一个对应的输入和输出。利用该输入输出流就可以发送和接受数据。
4.协议内容详解
参考http://www.cnblogs.com/li0803/archive/2008/11/03/1324746.html,协议具体内容讲解很详细
5.关于http1.0和http1.1的持续连接与非持续连接
HTTP/1.0和HTTP/1.1都有非持续连接(non-persistent connection)和持续连接(persistent connection)功能。非持续连接是指启动一次TCP连接服务机就向客户机传送一个对象,而持续连接是指服务机可在相同的TCP连接上向客户机发送多个对象。HTTP/1.0的默认设置是非持续连接,而HTTP/1.1的默认设置是持续连接。
在使用HTTP/1.0的情况下,如果打开一个包含一个HTML文件和10个内联图象对象的网页时,HTTP就要建立11次TCP连接才能把文件从服务机传送到客户机。而使用HTTP/1.1的情况下,如果打开同样的文件时,HTTP建立一次TCP连接就可把文件从服务机传送到客户机。使用一次TCP连接传送一个对象的效率比较低,这体现在下列几个方面:
(1) 每次TCP连接必需要建立和断开。客户机和服务机建立一次连接需要执行三向沟通连接法(three-way handshake),服务机在对象递送之后要断开TCP连接。在建立和断开连接时要占用CPU的资源。如果使用一次连接代替11次连接的话,占用客户机和服务机的CPU时间可大大减少。
(2) 对每次连接,客户机和服务机都必须分配发送和接收缓存。这就意味着要影响客户机和服务机的存储器资源,这同样要占用CPU的时间。
(3) 对由大数量对象组成的文件,TCP的低速启动算法(slow start-up algorithm)会限制服务机向客户机传送对象的速度。使用HTTP/1.1之后,大多数对象都可以尽最大的速率传送。
由于HTTP/1.1允许持续连接,文件中的所有对象都可在相同的TCP连接上传送。HTTP/1.1也允许在客户机接收到服务机的消息响应之前发送多个消息请求,这叫做流水线式请求(pipelined request)。
(此段转自http://blog.chinaunix.net/uid-9681606-id-1998549.html,感谢作者贡献)
6.