在刚毕业的时候用该功能做过一些web小偷程序,随着时间的推移工作的更换,渐渐的这些代码都淡出了我的电脑。今天在看资料的是时候发现一片类似的文章,于是就转载过来。
出处:http://www.javaeye.com/topic/260946
<script type="text/javascript"></script> 基于HTTP的协议的网络文件下载,工作原理建立在请求/响应模式(Request/Response)上:一个客户端与服务器建立连接后,客户端向Web服务器发出一个HTTP请求行;Web服务器在收到有效的请求后,返回一个状态行或多个响应标题、一个空白行和相关文档。HTTP协议使用的端口号,通常为80。开发基于http协议的网络文件下载必须掌握HTTP协议,包括向服务器发送请求和获取服务器响应状态的过程。HTTP1.0协议不支持断点续传功能. 本文用java提供了一个简单的实现.
1.HTTP协议工作方式
基于HTTP协议的客户/服务器模式的信息交换过程,它分四个过程:建立连接、发送请求信息、获取服务器响应状态、关闭连接。其中较为复杂的过程是:发送请求信息、获取服务器响应状态.
1)向服务器发送请求信息
一个HTTP请求由一个请求行、可选数目的请求标题、一个空白行,以及在POST情况下的一些额外的数据组成。请求行的格式是:
Method Request-URI HTTP-Vsersion CRLF
Method表示请求方法,如GET和POST
Request-URI标识了要请求的资源,
HTTP-Version表示请求的HTTP协议版本,
CRLF表示回车换行。
HTTP请求报文格式如下:
HTTP Command: //方法字段(GET方法,POST方法)
URI: //URL字段,发送请求至保存该网站的服务器。
HTTP Version: //http协议版本字段
Accept: //指示可被接受的请求回应的介质类型范围列表。
Accept-Language: //限制了请求回应中首选的语言为简体中文,否则使用默认值。
Accept-Encoding: //限制了回应中可接受的内容编码值
User-Agent: //定义用户代理,即发送请求的浏览器类型
Host: //定义了目标所在的主机
Connection: //告诉服务器使用连接类型
2)获取服务器响应状态
在发送HTTP请求行以后,程序就可以读取服务器的响应状态了。HTTP响应状态行包括:HTTP 状态码和一些HTTP响应标题。
HTTP回应报文
HTTP Version: HTTP/1.1 //服务器用的是HTTP/1.1版本
HTTP Status: 200 //请求成功,信息可以读取,包含在响应的报文中
Date: //响应报文的时间
Server: //响应报文的服务器
X-Powered-By: //表明运行环境
Set- cookie: //
Vary: //
Content-Length: //表明实体的长度
Connection: //告诉客户机在报文发送完毕后连接的状态
Content-Type: //表明实体中的对象类型(html文档)
Binary Data: //二进制数据
状态码表示响应类型,常用的有:
1×× 保留
2×× 表示请求成功地接收
3×× 为完成请求客户需进一步细化请求
4×× 客户错误
5×× 服务器错误
在程序中间,如果读到“HTTP/1.1 200 OK”这样的字符串,表明欲下载文件存在、该服务器支持断点续传,可以使用多线程下载。如果读到“HTTP/1.0 200 OK”这样的字符串,表明欲下载文件存在、但该服务器不支持断点续传,只可以使用单线程下载。
2.实现代