断点续传

所谓断点续传,简单来说,就是要从文件已经下载的地方开始继续下载。关键在于你向HTTP服务器发起文件请求的时候,是否明确的告知,要下载文件的哪个区域,我们都知道HTTP请求是有一个Header的,实际上里面有个属性是定义下载的区域的,这个属性就是Range,它接收的值是一个区间范围,比如:Range:bytes=0-10000 
这样我们就可以按照一定的规则,将一个大文件拆分为若干很小的部分,然后分批次的下载,每个小块下载完成之后,都合并到文件中,这样即时中间中断了下载,我们重新开始下载的时候,也可以通过文件的字节长度来判断下载的起始点,然后重启断点续传的过程,直到最后完成下载过程。



非断点续传的Http 


假设我们通过浏览器去下载一个名称为hello.zip的文件。那么浏览器发出的请求信息如下:

GET /hello.zip HTTP/1.1 
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/msword, application/vnd.ms-powerpoint 
Accept-Language: zh-cn 
Accept-Encoding: gzip, deflate 
User-Agent: Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)

Connection: Keep-Alive 


服务器收到请求后,按要求寻找请求的文件,提取文件的信息,然后返回给浏览器,返回信息如下:

200 
Content-Length=106786028 
Accept-Ranges=bytes 
Date=Mon, 30 Apr 2009 12:56:11 GMT 
ETag=W/"02ca57e173c12:95b"

Content-Type=application/octet-stream 
Last-Modified=Mon, 30 Apr 2009 12:56:11 GMT 


断点续传的http 


如果自己编的一个客户端程序来传递请求信息给Web服务器,要求从1000070字节开始。

GET /hello.zip HTTP/1.0 
User-Agent: NetFox 
RANGE: bytes=1000070-

Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2 


仔细看一下就会发现多了一行RANGE: bytes=1000070-,这一行的意思就是告诉服务器hello.zip这个文件从1000070字节开始传,前面的字节不用传了。

服务器收到这个请求以后,返回的信息如下:

206 
Content-Length=106786028 
Content-Range=bytes 1000070-106786027/106786028 
Date=Mon, 30 Apr 2009 12:55:20 GMT 
ETag=W/"02ca57e173c12:95b"

Content-Type=application/octet-stream 
Last-Modified=Mon, 30 Apr 2009 12:55:20 GMT 


和前面服务器返回的信息比较一下,就会发现增加了Content-Range一行,且返回的代码也改为206了,而不再是200了。

以上就是HTTP断点续传的原理,具体通过什么技术实现,比如Java、C++、Flex等,都可以实现 


java客户端简单代码实现 
(1) 用什么方法实现提交 RANGE: bytes=2000070-。 
当然用最原始的 Socket 是肯定能完成的,不过那样太费事了,其实 Java 的 net 包中提供了这种功能。代码如下: 

URL url = new URL("http://www.sjtu.edu.cn/down.zip"); 
HttpURLConnection httpConnection = (HttpURLConnection)url.openConnection(); 

// 设置 User-Agent 
httpConnection.setRequestProperty("User-Agent","NetFox"); 
// 设置断点续传的开始位置 
httpConnection.setRequestProperty("RANGE","bytes=2000070"); 
// 获得输入流 
InputStream input = httpConnection.getInputStream(); 

从输入流中取出的字节流就是 down.zip 文件从 2000070 开始的字节流。大家看,其实断点续传用 Java 实现起来还是很简单的吧。接下来要做的事就是怎么保存获得的流到文件中去了。 保存文件采用的方法。 
采用的IO 包中的 RandAccessFile 类。 
操作相当简单,假设从 2000070 处开始保存文件,代码如下: 
RandomAccess oSavedFile = new RandomAccessFile("down.zip","rw"); 
long nPos = 2000070; 
// 定位文件指针到 nPos 位置 
oSavedFile.seek(nPos); 
byte[] b = new byte[1024]; 
int nRead; 
// 从输入流中读入字节流,然后写到文件中 
while((nRead=input.read(b,0,1024)) > 0) 

oSavedFile.write(b,0,nRead); 


如何实现多线程下载 
多点传送怎么做呢?那就是多起几个线程,连接到服务器,用断点指令来传送文件,在传送的过程中,会检查前面的(比如说第一个蚂蚁)得到的文件的部分是否超过了后面的(比如说第二个蚂蚁)的起点,相等就停前面的蚂蚁,最后再合并几个部分,就得到一个完整的文件了。

 

 

原文地址:http://www.bangchui.org/read.php?tid=21616

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值